Upload
others
View
14
Download
0
Embed Size (px)
Citation preview
EKONOMETRİ
ORTAK DERS
PROF. DR. NİLGÜN ÇİL
İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ
ORTAK DERS
EKONOMETRİ
Prof. Dr. Nilgün ÇİL
Yazar Notu
Elinizdeki bu eser, İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi’nde okutulmak için
hazırlanmış bir ders notu niteliğindedir.
I
ÖNSÖZ
Ekonometri dersi, iktisat teorilerinin, uygulamada geçerliliğinin test edilmesi ve iktisat
politikaları için kullanılabilmesi amacıyla matematik, istatistik ve ekonometri bilimlerinin
araçlarından yararlanarak ölçülebilir somut modeller ortaya koymayı hedefler.
Ekonometri dersi, bu amacına ulaşmak için, iktisadi analiz için matematiksel,
istatistiksel ve ekonometrik teknik ve modellerden nasıl yararlanacağını analiz eder. Daha ileri
konularda ise ileri iktisat teorilerinin matematiksel istatistik ve ekonometri modellere
dönüştürülmesi ve bu teorilerin ampirik geçerliliğini test ederek iktisat teorisinin gelişimine
katkı sağlar, diğer yandan, istatistik ve ekonometrik araçlar kullanarak da iktisat politikalarında
karar vermede önemli bir araç özelliği görevi üstlenir.
II
İÇİNDEKİLER
ÖNSÖZ ........................................................................................................................................ I
İÇİNDEKİLER .......................................................................................................................... II
KISALTMALAR .................................................................................................................... VII
YAZAR NOTU ..................................................................................................................... VIII
1. EKONOMETRİYE GİRİŞ ..................................................................................................... 1
1.1. Ekonometri Nedir? Ekonometrinin Gerekliliği ............................................................... 7
1.2. Ekonometrinin Amacı ve Yöntemi ................................................................................. 8
1.3. Ekonometrik Model ....................................................................................................... 12
1.4. İktisadi Veri Türleri ....................................................................................................... 13
1.4.1. Zaman Serisi Verisi .......................................................................................... 14
1.4.2. Yatay Kesit Verisi ............................................................................................ 15
1.4.3. Panel Veri ......................................................................................................... 16
1.5. İktisadi Veri Kaynakları ................................................................................................ 17
1.6. Ekonometride Bilgisayarın ve Paket Programların Yeri ............................................... 17
2. REGRESYON ANALİZİNE GİRİŞ .................................................................................... 27
2.1. Regresyon Analizine Giriş ............................................................................................ 33
2.2. Regresyon ve Korelasyon .............................................................................................. 35
2.3. Ana kütle Regresyon Modeli ......................................................................................... 36
3. BASİT DOĞRUSAL REGRESYON MODELİ .................................................................. 63
3.1. Regresyon Parametrelerinin Tahmini ............................................................................ 69
3.2. En Küçük Kareler Yaklaşımı ........................................................................................ 69
3.2.1. Basit Regresyon Modelinin Tahmini İçin En Küçük Kareler Yöntemi ........... 69
3.2.2. En Küçük Kareler Yönteminin Sapmalar Kuralı ile Uygulaması .................. 72
3.3. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları ............................................ 75
III
4. EN KÜÇÜK KARELER TAHMİNCİLERİNİNDEĞERLENDİRİLMESİ ...................... 100
4.1. En Küçük Kareler Tahmincilerinin Değerlendirilmesi ............................................... 106
4.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları ............................... 106
4.3. Hata Terimi Varyansının Tahmini ........................................................................... 109
4.4. Uygulama: Satış Gelirleri İle Reklam Harcamaları ................................................. 110
4.5. Esneklikler ................................................................................................................... 111
4.6. Uygulama: Satış Gelirleri İle Reklam Harcamaları .................................................... 112
5. ARALIK TAHMİNİ VE HİPOTEZ TESTİ ....................................................................... 123
5.1. Aralık Tahmini ............................................................................................................ 129
5.1.1. Normal Dağılım ve t-Dağılımı ....................................................................... 129
5.1.2 Aralık Tahminlerini Elde Etme ....................................................................... 131
5.1.3. Açıklayıcı Uygulama: Satış Modeli ............................................................... 132
5.2 Hipotez Testleri ........................................................................................................... 133
5.2.1 Temel Hipotez ................................................................................................. 134
5.2.2 Alternatif Hipotez ........................................................................................... 134
5.2.3 Test İstatistiği .................................................................................................. 134
5.2.4. Red Bölgesi .................................................................................................... 135
5.2.5. Karar .............................................................................................................. 135
6. UYUMUN İYİLİĞİ ........................................................................................................... 147
6.1. Uyumun İyiliğinin Ölçülmesi ve Önemi ..................................................................... 153
6.2. Belirginlik katsayısı ..................................................................................................... 153
6.3. Tahmini Standart Hatası .............................................................................................. 158
6.4. Genelleştirilmiş 2r ...................................................................................................... 159
6.5. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları .......................................... 160
IV
7. UYUMUN İYİLİĞİ VE MODELLEME KONULARI ..................................................... 176
7.1. Orijinden Geçen Regresyon ........................................................................................ 182
7.2. Fonksiyonel Biçimin Belirlenmesi .............................................................................. 183
7.2.1. Log-Log Model (Tam Logaritmik Model) .................................................... 185
7.2.2. Log-Doğrusal Model ..................................................................................... 189
7.2.3. Doğrusal-log Model ....................................................................................... 191
7.3. Hata Terimleri için Normal Dağılımın Testi: Jarque-Bera Testi ............................... 194
8. ÇOK DEĞİŞKENLİ REGRESYON MODELİ ................................................................. 207
8.1. Çok Değişkenli Regresyon Modeli ............................................................................. 213
8.2. Çok Değişkenli Regresyon Modelinin Varsayımları .................................................. 215
8.3. Çoklu Değişkenli Regresyon Modeli Parametrelerinin Tahmini: En Küçük Kareler
Yöntemi .............................................................................................................................. 217
8.4. Açıklayıcı Örnekler : İthalat Modeli ........................................................................... 219
8.5. Hata Terimi Varyansının ( 𝛔𝟐 )Tahmini ..................................................................... 222
8.6. Açıklayıcı Örnek: İthalat Modeli ................................................................................ 223
9. Çok Değişkenli Regresyon MOdeliNde AraLIK TAHMİNİ VE HİPOTEZ TESTİ ......... 236
9.1. En Küçük Kareler Tahmincilerinin Örnekleme Özellikleri ........................................ 242
9.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları .................................. 242
9.3. En Küçük Kareler Tahmincilerinin Dağılımı .............................................................. 245
9.3.1. Aralık Tahmini ............................................................................................... 246
9.3.2. Hipotez Testi .................................................................................................. 247
9.4. Uyum İyiliğinin Ölçülmesi: Belirginlik Katsayısı ...................................................... 248
10. ÇOK DEĞİŞKENLİ REGRESYON MODELİNDE İLERİ ÇIKARSAMA ................... 260
10.1. Birleşik Hipotezlerin Testi .................................................................................. 266
10.2. F-testi ................................................................................................................... 266
V
10.3. Modelin Anlamlılığının Testi .............................................................................. 269
10.3. F- ve t- Testleri Arasındaki İlişki ............................................................................. 271
10.4. Varyans Analiz (ANOVA) Tablosu ......................................................................... 272
11. OTOKORELASYON ....................................................................................................... 286
11.1. Otokorelasyon Nedir?................................................................................................ 292
11.2. En Küçük Kareler Tahmincileri İçin Otokorelasyonun Sonuçları ............................ 293
11.3. Otokorelasyonun Tespit Edilmesi ............................................................................. 293
11.3.1. Sistematik Olmayan Test: Kalıntı Grafikleri ............................................... 293
11.3.2. Sistematik Testler ......................................................................................... 294
11.3.3. Otokorelasyonun Varlığı Durumunda Parametre Tahmin Yöntemleri ........ 303
12. DEĞİŞEN VARYANS (HETEROSKEDASİTE) ........................................................... 314
12.1. Değişen Varyansın Yapısı ......................................................................................... 320
12.2. En Küçük Kareler Tahmincileri İçin Değişen Varyansın Sonuçları ......................... 324
12.3. Değişen Varyansın Tespit Edilmesi .......................................................................... 325
12.3.1. Sistematik olmayan test: Kalıntı Grafikleri ................................................. 326
12.3.2. Sistematik Testler ......................................................................................... 326
12.4. Değişen Varyansın Varlığı Durumunda Parametre Tahmin Yöntemleri .................. 339
13. ÇOKLU DOĞRUSAL BAĞLANTI ................................................................................ 351
13.1. Çoklu Doğrusal Bağlantının Sebepleri ...................................................................... 358
13.2. Çoklu Doğrusal Bağlantının Dereceleri .................................................................... 358
13.3. Çoklu Doğrusal Bağlantının Sonuçları ..................................................................... 360
13.4. Çoklu Doğrusal Bağlantının Tespiti .......................................................................... 360
14. SPESİFİKASYON HATALARI ...................................................................................... 371
14.1. Modelin Büyüklüğü İle İlgili Hatalar ........................................................................ 377
14.2. Modelin Matematiksel Kalıbı İle İlgili Hatalar ......................................................... 379
VI
14.3. Ölçme Hataları .......................................................................................................... 384
KAYNAKÇA ......................................................................................................................... 398
VII
KISALTMALAR
Kısaltma yoktur.
VIII
YAZAR NOTU
Önsöz’de detaylı açıklandığı gibi, Ekonometri dersi, iktisat teorilerinin, uygulamada
geçerliliğinin test edilmesi ve iktisat politikaları için kullanılabilmesi amacıyla matematik,
istatistik ve ekonometri bilimlerinin araçlarından yararlanarak ölçülebilir somut modeller
ortaya koymayı hedefler. Ancak ders, açık ve uzaktan eğitim ihtiyaçlarına yönelik olarak en
temel düzeydeki konuları sade bir dille açıklayıp öğretmeyi hedeflemek için tasarlanmıştır.
Öğrencilerin ekonometriyi anlayıp sindirebilmeleri için her bir konuyu anladıklarına ve
sorularını çözebildiklerine emin olduktan sonra bir sonraki konuya geçmeleri daha sağlıklı
ilerlemeleri için önemlidir. Kitabın öğrencilere yararlı olması dilerim.
1
1. EKONOMETRİYE GİRİŞ
2
Bu Bölümde Neler Öğreneceğiz?
1.1. Ekonometri Nedir? Ekonometrinin Gerekliliği
1.2. Ekonometrinin Amacı ve Yöntemi
1.3. Ekonometrik Model
1.4. İktisadi Veri Türleri
1.4.1. Zaman Serisi Verisi
1.4.2. Yatay Kesit Verisi
1.4.3. Panel Veri
1.5. İktisadi Veri Kaynakları
1.6. Ekonometride Bilgisayarın ve Paket Programların Yeri
3
Bölüm Hakkında İlgi Oluşturan Sorular
1) Ekonometri nedir?
2) Ekonometrinin iktisat bilimi ile ilişkisi nedir?
3) Ekonometriyi öğrenmenin iktisat öğrencisine sağlayacağı katkı ne olacaktır?
4
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Ekonometri Kavramı Ekonometrinin önemi ve
işlevini detaylı olarak ortaya
koyabilmek.
Ders notları
Ekonometrinin bileşenleri Ekonometrinin iktisat,
matematik ve istatistikten
ilişkisi açıklayabilmek
Ders notları
Ekonometrinin metodolojisi Ekonometrik çalışmanın
aşamalarını anlamış olmak
Ders notları
Veri Ekonometrik çalışmada
kullanılan İktisadi veri
türlerini ve özelliklerini
açıklamak
Ders notları
5
Anahtar Kavramlar
Ekonometri
Matematiksel Model
Ekonometrik Model
Bağımlı Değişken
Bağımsız Değişken
Hata Terimi
Gözlemlenmiş (Geriye Dönük) Veri
Frekans (Veri Sıklığı)
Zaman Serisi Verisi
Yatay Kesit Verisi
Panel Veri
6
Giriş
Bu bölümde iktisat öğrencilerinin “Niçin Ekonometri Öğreniriz?” sorusuna cevap
arayacak, iktisatçıların eğitiminde özel bir role sahip olan ekonometrinin önemi, metodolojisi
ve uygulama alanı üzerinde duracağız. Siz iktisat öğrencileri iktisat eğitiminin ilk yıllarında
İktisada Giriş, Makro İktisat ve Mikro İktisat derslerinde arz ve talep, çarpan katsayısı, marjinal
maliyet, ortalama maliyet, fırsat maliyeti, kıt kaynaklar ve karşılaştırmalı üstünlük gibi
kavramları öğreniyor, para politikası ve maliye politikasının işleyişini ve piyasalar üzerindeki
etkilerini, hükümet politikalarının piyasayı nasıl etkilediğini öğreniyorsunuz. Kısaca bir iktisat
öğrencisi olarak, “bir iktisatçı gibi düşünmeyi” öğreniyorsunuz. Bu bağlamda iktisat eğitimi,
İktisat Fakültesi mezunu bir öğrenciye mezuniyet sonrası gerek kamu gerekse özel sektörde
geniş bir iş yelpazesi sunar.
Mezuniyet sonrası iş dünyasına girmek isteyen İktisat Fakültesi mezunundan, işveren
“Şirketimiz için ne yapabilirsiniz?” sorusuna cevap almak isteyecektir. İktisat eğitimi alan
birinin “ Bir iktisatçı gibi düşünebilirim” cevabı, işvereni tatmin edecek yeterli bir cevap
olmayabilecektir. Bir iktisat öğrencisinin lisans eğitiminde öğrenmiş olduğu bilgi ile
iktisatçıların gerçekte ne yaptığı arasında farklılık vardır. Özel sektörde veya kamu sektöründe
çalışan iktisat mezunları genellikle uygulamalı iktisadi analiz ile ilgilenirler. Uygulamalı
iktisadi analizden kasıt, iktisadi verileri kullanarak iktisadi ilişkileri tahmin etmek, iktisadi
hipotezleri test etmek ve iktisadi gelişmeleri öngörmektir.
Ekonometriyi öğrenmek, iktisat öğrencisi olmak ile uygulamalı iktisatçı olma arasındaki
arasındaki farkı kapatır. Ekonometri eğitimi alan ve ekonometriyi kullanabilen bir iktisat
Fakültesi mezunu, işverenin yukarıdaki sorusuna “ Ürününüzün satış öngörüsünü yapabilirim”,
“Rakiplerinizin ürün fiyatını 1 lira düşürdüğünde, satışlarınız üzerindeki etkileri tahmin
edebilirim”, “Reklam harcamalarınızın satışlarınızı gerçekten arttırıp arttırmadığını test
edebilirim” gibi detaylı cevap verebilecektir. Bu cevaplar hem bir iktisatçı gibi
düşünebildiğinizi hem de iktisadi verileri kullanabilme yeteneğine sahip olduğunuzu yansıttığı
için, şüphesiz işvereni daha memnun edici cevaplardır. Dolayısıyla ekonometri, iş
başvurusunda bulanan iktisat mezununa işe girmede önemli bir avantaj sağlayacaktır.
İktisadi ölçüm için temel olan ekonometri ve ekonometrinin önemi İktisat Biliminin
ötesine yayılmıştır. Ekonometrik yöntemler günümüzde muhasebe, finans, pazarlama, yönetim
gibi işletme disiplinlerinde, sosyoloji, psikoloji
7
1.1. Ekonometri Nedir? Ekonometrinin Gerekliliği
İktisat ilminin dayandığı iktisat teorisi, iktisadi değişkenler arasındaki ilişkilerin
özelliklerini ve iktisadi olayları açıklamaktadır. En iyi teori, şüphesiz bütün değişkenleri ve bu
değişkenler arasındaki bağlantıları eksiksiz olarak ele alan ve ekonominin işleyişini bir zaman
dilimi içinde (statik) veya zaman akımı çerçevesinde (dinamik) gösterebilen teoridir. Bu
bağlamda iktisat teorisi değişkenler arasındaki ilişkilerin genel eğilimi ve değişkenler arsındaki
sebep sonuç bağlantısı hakkında bilgi verir. Ancak iktisat teorisi genel olarak varsayımlar ve
hipotezlere dayanmakta olup, ampirik bir çalışmadan yoksundur. İktisat teorisi ile gerçekler her
zaman birebir örtüşmezler hatta önemli çelişkiler olabilir.
Ekonometri, iktisadi ilişkileri tahmin etmek, iktisadi teorileri test etmek, devlet veya
işletme politikalarını değerlendirmek ve uygulamak için istatistiksel yöntemlerin kullanımına
dayanmaktadır.
Ekonometrinin bu tanımına göre, ekonometrik bir çalışmanın temelinde iktisat teorisi
vardır. Ekonometri; matematik ve istatistik disiplinlerinden faydalanarak, iktisat teorisinin
belirlediği ilişkiler ile ilgili sayısal sonuçlara ulaşır, varılan sonuçların analizini yapar, teori ile
sayısal verilere göre belirlenen gerçekler arasındaki uygunluk ve çelişkileri analiz ederek
varılan sonuçların güvenilirliğini test eder. Böylece ekonometri, eğilimler yerine sayısal
değerler verdiği için, teorinin belirlediği iktisadi realitenin kıyaslanmasını sağlar. Kısaca
ekonometri, iktisadi ölçüm anlamına gelmektedir.
Şekil-1.1: Ekonometri biliminin diğer bilim dallarıyla ilişkisi
İktisat teorisi, matematik ve istatistiğin bir bileşimi olan ekonometri, bu üç bilim dalının
her birinden bütünüyle farklıdır. İktisat teorisi, matematik ve istatistik ile bunların bileşimleri
iktisadi istatistikler, matematiksel istatistik ve matematiksel iktisat günümüz iktisadi
olaylardaki nicel ilişkilerin kavranması için gerekli olmakla birlikte hiçbiri tek başına yeterli
değildir.
8
Ekonometri; kuramsal iktisat, matematiksel iktisat ve iktisadi istatistikten ayrı bir bilim
dalıdır. Çünkü;
• İktisat teorisi genellikle önsavlar (hipotezler) öne sürer. İktisat teorisi iki veya daha
fazla değişken arasındaki ilişkinin yönüne odaklanırken, ilişkinin sayısal ölçümünü vermekten
uzaktır. Ekonometri ise, iktisat kuramına ampirik bir içerik katar.
• Matematiksel iktisadın görevi iktisat kuramını matematiksel kalıplar içerisine
sokmaktır. Matematiksel eşitliklerin ekonometrik eşitlikler haline sokulması ve doğrulanması
ise ekonometrinin konusudur.
• İktisadi istatistiğin ilgi alanı iktisadi verileri derlemek ve işlemektir. Toplanan bu
verilerin kullanılarak iktisat teorilerinin doğrulanması sayısal kestirimlerin yapılması ise
ekonometrinin konusudur.
Bu bağlamda ekonometri iktisat teorisinin belirlediği iktisadi ilişkileri en uygun, en
gerçekçi, işlenebilir matematiksel bir model içinde ele alarak, değişkenler arasındaki
bağlantıyı kuran parametrelerin sayısal değerlerini en doğru tahmin edecek yöntemleri araştırır.
Ekonometri, “ne kadar” sorularına cevap vermek için, istatistik yöntemler ile birlikte,
iktisat, işletme ve diğer sosyal bilimlerdeki teori ve verileri nasıl kullanacağımız ile ilgilidir.
Genel olarak ekonometri, iktisadi verileri ve aralarındaki ilişkileri analiz etmek için
iktisat teorisi ve istatistik yöntemleri kullanma bilimi ve sanatıdır. Makro iktisat, mikro iktisat,
çalışma ekonomisi, finans, pazarlama ve iktisat politikası dahil olmak üzere ekonominin birçok
bilim dalında ekonometrik yöntemler yoğun olarak kullanılmaktadır.
1.2. Ekonometrinin Amacı ve Yöntemi
Ekonometrinin amacı iktisat teorisinin belirlediği iktisadi ilişkileri kantitatif bir model
çerçevesinde ele alarak değişkenlerin değişme sebeplerini sayısal ölçülerle ifade etmek ve bu
değişkenlerin gelecekte alabilecekleri değerleri tahmin edebilmek ve iktisat teorilerinin
doğruluğunu test etmektir.
Genel olarak ekonometri, teorik ekonometri ve uygulamalı ekonometri olarak ikiye
ayrılır. Gerek teorik ekonometriye gerekse uygulamalı ekonometriye Klasik ya da Bayesgil
geleneklerle yaklaşılabilinir. Ancak ekonometriye giriş düzeyindeki kitaplarda genellikle klasik
yaklaşım tercih edilmekte, Bayesgil yaklaşım kullanılmamaktadır. Bu derste de klasik yaklaşım
kullanılacaktır.
Teorik ekonometri ile uygulamalı ekonometrinin birbirinden tamamen ayrılmış olan
alanlarını belirlemek ve iki disiplinin kesin sınırlarını çizmek zordur. Teorik ekonometri, bir
yandan en uygun ekonometrik modellerin geliştirilmesi sorununu incelerken, diğer yandan
ekonometrik modeller için en uygun parametre tahmin yöntemlerini inceler. Uygulamalı
ekonometri ise, gerçek verilere dayanarak ilgili iktisadi olay için en uygun kabul edilen
9
ekonometrik modelin parametrelerini en iyi biçimde tahmin edip, bunun sonuçlarını incelemek
gibi konularla ilgilenir.
Teorik ekonometri, genel iktisat teorisi ile en ileri iktisat teorisi prensiplerinden
başlayarak, model yapımı, matematiksel modeller bilgisinin ışığında ekonometrik modellerin
yapımı için gerekli teorik bilgiyi verir. Ayrıca teorik ekonometri, modellere uyan parametre
tahmini için gerekli yöntemleri gösterir ve en uygun modelin en iyi parametre tahmini yollarını
ayrıntılı olarak araştırır. Uygulamalı ekonometri ise kantitatif araştırma alanı ve konusu ile ilgili
en uygun modelin seçimini yapar, modelin parametre tahminine elverişlilik ve yeterlilik
şartlarını araştırır, en uygun parametre tahmin yöntemlerini seçer. Kısaca uygulamalı
ekonometri, araştırma konusu olan alanın seçilmesinden, gerekli verilerin toplanıp, işlenip
rafine hale getirilmesinden, en uygun ekonometrik modelin belirlenip en iyi parametre tahmin
yönteminin seçilip uygulamasından tahmin ve testlere kadar uzanan halkalarda oluşan bir
zincirdir.Ekonomik modellerin ekonometrik analizinde gerekli adımlar aşağıdaki şemada
verilmiştir.
Ekonometrik modelin başarısı öncelikle iktisat teorisinin iyi anlaşılmasına bağlıdır.
Ekonometrik araştırmanın dayandığı iktisat teorisinin unsurları iktisadi değişkenler arasındaki
ilişkilerin doğru tespit edilmesi gerekmektedir. Aksi takdirde temeli olmayan bir binanın inşa
edilmesi söz konusu olup, temeli olmayan binanın çökeceği gibi, teoriden yoksun ekonometrik
modelin tahmini de gerçeği yansıtmaktan uzak olacaktır.
İktisat teorisinin ilişkileri önce matematik terimleri ile ifade edilir, diğer bir ifade ile
matematiksel model kurulur. Matematiksel model çeşitli iktisadi ilişkileri tanımlamaktadır.
Matematiksel modelden ekonometrik modele geçilir. Ekonometrik modelin en önemli özelliği
rassal bir öğe (hata terimi) içermesidir. (daha sonra matematiksel model ile ekonometrik
modelin farklılığı açıklanacaktır.) Modelde yer alan değişkenlere ait ölçümler yapılarak,
modelin tahmini için gerekli olan veriler elde edilir. Daha sonraki aşamada iktisadi ilişkilerin
katsayılarının sayısal değerlerini bulmak için ekonometrik tahmin yöntemleri kullanılır.
Aşağıda verdiğimiz şemayı bir örnekle şu şekilde açıklayabiliriz. İktisat teorisi bir
kişinin tüketiminin, harcanabilir gelirine, servetine, zevk ve alışkanlıklarına bağlı olduğunu
öngörür. Bu kesin bir ilişkiyi ifade etmektedir. Çünkü tüketimin bütünüyle bu üç etmen
tarafından belirlendiği, bunların dışında hiçbir etmenin tüketimi etkilemediği sonucu ortaya
çıkmaktadır.
10
Şekil-1.2: Ekonometrik analizin adımları
11
Ct f (Yht ,Wt ,t)
Burada,
Ct = Tüketimi
Yht = Harcanabilir geliri
Wt = Serveti
t =Zevk ve alışkanlıkları gösteren trend değişkenini ifade etmektedir.
Matematiksel iktisatta tüketimin yukarıdaki soyut iktisadi ilişkisi matematik terimleri
ile ifade edilir ve aşağıdaki tüketim denklemi yazılabilir.
Ct 0 1Yht 2Wt 3t
Burada 0 , 1, 2 ve 3 ise matematiksel modelin katsayılarıdır. Bu matematiksel model
kesin ilişkileri göstermektedir, çünkü tüketim sadece eşitliğin sağ tarafındaki iktisadi
değişkenler tarafından açıklanmaktadır. Ancak iktisadi gerçekler göstermektedir ki, tüketimi
iktisadi krizler, vergi düzenlemeleri gibi başka iktisadi unsurlar da etkileyebilmektedir. Ayrıca
insan davranışı, psikolojik ve toplumsal etmenlerin etkisi altındadır ve düzenli değildir.
Dolayısıyla tüketim modeli sıraladığımız değişkenlerin de etkisi altında olduğuna göre
matematiksel modeldeki kesinlikten uzaklaşacaktır. Model dışındaki bu etmenler dikkate
alındığında model aşağıdaki gibi rastlantısal (stokastik) biçimi alır ve ekonometrik model
olarak adlandırılır.
Ct 0 1Yht 2Wt 3t ut
Yukarıdaki denklemde yer alan u, hata terimi adını alır. Ekonometrik modelin,
matematiksel modelden farkı bünyesinde hata terimini barındırması ve dolayısıyla kesin
ilişkileri değil, rastlantısal ilişkileri ifade etmesidir.
Bundan sonraki adım ekonometrik modelde yer alan değişkenlere ilişkin gerçek
verilerin sağlanmasıdır. Daha sonra model ekonometrinin kendine özgü yöntemleri ile tahmin
edilir ve parametre olarak adlandırılan modelin katsayılarının sayısal değerleri elde edilir.
Modelin tahmininden sonraki aşama, modelin geçerliliğinin test edilmesidir. Tahmin
edilen modelin sonuçlarının öncelikle iktisat teorisi ile uyumlu olması gerekmektedir. Şöyle ki;
tüketim modelinde harcanabilir gelirin katsayısı ( 1 ) tanım gereği (ileride tekrar üzerinde
durulacaktır) marjinal tüketim meyline eşittir. Marjinal tüketim meyli ise 0 ile 1 değerleri
arasında yer almaktadır. Eğer model tahmini sonucunda 1, bu sınırlar dışında ise tahmin
sonuçları iktisadi açıdan kabul edilemez, bu durumda model ilk aşamadan itibaren yeniden ele
alınmalı ve hatanın kaynağı araştırılmalıdır.
12
. Modelin geçerliliğinin testinden diğer bir kasıt, modelin ekonometrik açıdan temel
varsayımlara uygunluğudur.
Test sonuçlarına göre uygun model herhangi bir hipotezin testinde, iktisat politikası
modelinin oluşumunda ve geleceğin tahmininde kullanılabilir.
Yukarıda da görüldüğü üzere, matematiksel terimlerle ifade edilen, genel iktisat
teorisiyle iktisadi gerçeklerin nicel ölçümünün birleştirildiği, kendine özgü tahmin yöntemleri
olan ekonometrinin üç temel amacı vardır. Bunlar:
1. İktisat teorilerinin doğruluğunun sınanması,
2. İktisadi ilişkilerin katsayıları için sağlanan sayısal tahminleri, iktisat politikası
yapımında kullanmak,
3. Parametrelerin sayısal tahminlerinden iktisadi değişkenlerin gelecekteki değerlerini
tahmin etmektir. Faiz oranları, enflasyon oranları, GSYİH gibi makro iktisadi değişkenlerin
ileriye yönelik tahminleri ekonometrinin en yaygın uygulamalarındadır.
Ekonometrinin amacı iktisadi olayları ve iktisadi değişkenler arasındaki ilişkileri
kantitatif bir model içinde ele alarak değişkenlerin değişme sebeplerini sayısal ölçülerle ifade
etmek ve bu değişkenlerin gelecekte alabilecekleri değerleri tahmin edebilmektir. Buna göre
ekonometri biliminin nihai hedefi iktisadi olayların kantitatif ölçülerle izahını yapabilmek ve
geleceğin yine kantitatif olarak tahminini yapabilmektir.
1.3. Ekonometrik Model
Ekonometrik modellerin en önemli özelliği rastlantısal bir değişken olan hata terimi
içermesidir. İktisat teorisi ve matematiksel iktisat, iktisadi değişkenler arasında kesin ilişkiler
kurar. Ekonometri, iktisadi ilişkilerin kesin olduğunu kabul etmez ve bu ilişkilerin rassal
bileşeni ile ilgilenir. Aşağıda matematiksel bir model verilmiştir.
Y X
Burada yer alan α ve β modelin katsayılarıdır. Matematiksel modelde X değişkeninin
sabit bir değerine karşın Y değişkeni belli bir değer alır. Örneğin;
2 0.5Y X
matematiksel modelinde X değişkeni 1’e eşit ise, Y değişkeni 2.5 değerini alacaktır, başka bir
değer alması beklenmez. Ancak ekonometrik model kesin olmayan ilişkileri gösterdiğinden X
değişkeni sabit bir değere eşit iken, Y farklı değerler alabilir. Ekonometrik model aşağıdaki
gibidir.
i i iY X u
13
Ekonometrik modelde, modelin sağ tarafındaki değişken genel olarak bağımsız
değişken, sol tarafındaki değişken ise bağımlı değişken olarak adlandırılır. Ancak aşağıda
gösterildiği üzere farklı biçimlerde de adlandırılmaktadır.
Tablo-1.1: Bağımlı ve bağımsız değişken kavramları
Hata terimi, çeşitli iktisadi büyüklükler arasında kesin ilişkiler öngören iktisat teorisi ve
matematiksel iktisat tarafından göz ardı edilir. Ekonometride ise iktisadi ilişkilerin rassal
bileşenleriyle ilgili varsayımlarda bulunulmuş ve yeni yöntemler geliştirilmiştir.
1.4. İktisadi Veri Türleri
Veriler, iktisadi olaylar ve ilişkiler hakkında bilgi veren ve sayılarla ifade edilebilen
bilgi (enformasyon) kaynaklarıdır. Ekonometrik modeli tahmin edebilmek için verilere ihtiyaç
vardır ve ekonometrik modelin başarısı uygun ve güvenilir verilerin bulunmasına bağlıdır.
İktisatçılar ve sosyal bilimcilerin ilgilendiği ve ekonometrik modellerde yer alan
değişkenlere ait veriler Gözlenen veriler veya geriye dönük veriler olarak da adlandırılmaktadır.
Ekonometrik modellerde kullanılan verilerin bir örneği anket verileridir. Anketler kişilere
doğrudan, telefonla veya posta yolu ile gerçekleştirilmektedir. Ankete katılacak kişiler rassal
olarak seçilir ve anket sorularının cevapları kaydedilir. Böyle bir araştırmada, değişkenlere
yönelik veriler eşanlı olarak toplanmış olup, toplanan değerler ne sabittir ne de
tekrarlanabilirdir. GSYİH, faiz oranı, üretim miktarı, borsa endeksi, üretimin gerçekleşmesi için
kullanılan emek ve sermaye iktisadi verilere örnek olarak verilebilir.
Bir teoriyi test etmek veya bir ilişkiyi tahmin etmek amacıyla oluşturulan ekonometrik
model için gerekli olan veriler çeşitli kaynaklardan elde edilir.
Veriler çeşitli düzeyde toplulaştırmalardan elde edilebilir,
Bireyler, hane halkları ve firmalar gibi iktisadi karar vericiler üzerine mikro-veriler
toplanabilir.
Yerel, bölgesel veya ulusal düzeylerde, bireyler, hane halkları ve firmalar üzerine
havuzlama veya toplulaştırma ile makro-veriler toplanabilir.
Veriler ayrıca bir akım veya stok durumunu temsil edebilir:
Y X
Bağımlı değişken Bağımsız değişken
Açıklanan değişken Açıklayıcı değişken
İçsel (Endogen) değişken Dışsal (Egzogen) değişken
Öngörülen değişken Öngören değişken
Tepki değişkeni Kontrol değişkeni
14
Akım-veriler, 2010’un son çeyreği boyunca benzin tüketimi, bir işletmenin 2013
daki üretimi gibi bir zaman dönemi süresince ölçümü gösterir.
Stok-veriler, 1 Ocak 2014’da Merkez Bankası döviz rezervi veya BIST 100’de
işlem gören Garanti Bankasının 1 Mart 20014’deki varlık değeri gibi zamanın belirli bir
noktasındaki değerlerin ölçümünü gösterir.
Veriler niceliksel veya niteliksel olabilir:
Niceliksel veriler, reel fiyatlar veya kişi başına gelir gibi, sayılar veya bunların
kısmen dönüştürülmesi ile ifade edilebilen gelir veya fiyatlar gibi verilerdir.
Niteliksel veriler, ya öyle-ya böyle durumlarını gösterir. Örneğin, bir tüketici belirli
bir malı ya satın alır ya satın almaz veya bir kişi ya evlidir ya da değildir.
Ekonometrik modelin tahmini için kullanılan çeşitli veri setleri mevcuttur. Uygulamalı
çalışmalarda kullanılan en önemli iktisadi veri setleri aşağıdaki gibidir:
1.4.1. Zaman Serisi Verisi
Zaman serisi verileri bir veya birkaç değişkenin dönemler itibariyle gözlenen değerler
takımıdır. Bu tür veriler nicel veya nitel olabilmektedir. 2010 Ocak ayı için BİST-100 endeksi
günlük kapanış fiyatları, 2000-2010 yılları arası Akbank hisse senedine ilişkin yıllık getiri
rakamları, üçer aylık GSMH rakamlarının her biri zaman serisi verisine örnek teşkil etmektedir.
Örneklerden de anlaşılacağı üzere, zaman serisi verileri yıllık, 6 aylık, 3 aylık, günlük v.b.
frekanslarla oluşturulabilmektedir. Frekans veri toplanırken kullanılan veri sıklığıdır. İktisatta
en yaygın kullanılan frekanslar günlük, aylık, üçer aylık ve yıllıktır.
İktisadi zaman serisi verilerinin temel özelliklerinden biri kendi yakın tarihleri ile
kuvvetli ilişkili olduğudur. Bu durum iktisadi değişkenlerin bir trende (trend, genel eğilim
anlamına gelmektedir.) sahip olduğunu göstermektedir. Örneğin GSYİH zaman içinde artan bir
trende sahiptir. İktisadi zaman serilerinin diğer bir özelliği mevsimsel özellik taşıyabilmesidir.
Haftalık, aylık ve üçer aylık zaman serileri genellikle mevsimsel özelliklere sahiptir. Örneğin
üçer aylık GSYİH, turizm gelirleri değişkenlerine ilişkin zaman serisi verileri mevsimsel
özellikler taşımaktadır.
15
Genel olarak zaman serisi verisi, ekonometrik modelde yer alan değişkenlerin zaman
boyutu çerçevesindeki değişmelerinin sayısal ifadesidir. Zaman serisi verilerinin ekonometrik
modelde gösterimi ile ilgili aşağıdaki basit model açıklayıcı olacaktır.
0 1t tC Y ,
Bu modelde yer alan
tC = t zamanındaki tüketimi,
tY = t zamanındaki geliri
ifade etmektedir. 0 ve 1 ise modelin parametreleridir. t zaman dizisi, verileri alınacak
tüketim (C ) ve gelir (Y) değişkenlerinin t=1,2,…,T örnekleme dönemi için sayısal
değerlerdir.
1.4.2. Yatay Kesit Verisi
Yatay kesit verileri, belli bir zaman noktasında derlenen verilerden oluşmaktadır. Yatay
kesit verileri bireyler, hane halkları, firmalar, ülkeler, iller gibi farklı iktisadi birimler hakkında,
birimlerin aldığı belli bir zaman noktasında aldığı değerler açısından bilgi verir. Örneğin;
BİST’de işlem gören hisse senetlerinin 6 Temmuz 2017 tarihindeki kapanış fiyatları, G20
ülkelerinin 2009 yılı büyüme rakamları, AB ülkelerinin 2008 yılı nüfus artış hızları ve iller
itibariyle 2005 yılı GSMH rakamları, İktisat Fakültesi 5.yarıyıl öğrencilerinin Ekonometri final
sınav notları v.b.
Yatay kesit verileri iktisat ve sosyal bilimlerde yoğun olarak kullanılmaktadır. Zamanın
belirli bir noktasında bireyler, hane halkları, firmalar ve illerden derlenen veriler, mikro iktisadi
hipotezleri test etmek ve iktisat politikalarını değerlendirmek açısından önemlidir.
Yatay kesit verilerinin önemli bir özelliği, ana kütleden rassal örnekleme ile edildiği
varsayımına dayanmasıdır. Örneğin hane halkı tüketimi ile geliri arasında bir ilişkinin
16
araştırıldığı ekonometrik bir uygulamada, Türkiye’deki hane halklarından örneğin 100 tanesi
rassal olarak çekilmekte ve bu ailelerden yatay kesit verileri elde edilmektedir.
Yatay kesit verilerin ekonometrik modelde gösterimi aşağıdaki gibidir.
0 1i iC Y
Bu modelde yer alan
iC = i. tüketicinin belli zaman noktasındaki tüketimi,
iY =i. tüketicinin belli zaman noktasındaki geliri
0 ve 1 modelin parametreleridir. Yatay kesit verilerinin kullanıldığı modellerin özelliği
zaman boyutunun sabit olmasıdır. Modelin matematiksel biçimi i=1,2,…,n tüketici için
aynıdır.
1.4.3. Panel Veri
Panel veriler, yatay kesit verilerinin çeşitli zamanlardaki değerleridir. Zaman boyutu
olan bireysel mikro-birimlere ile ilgili gözlemler panel verilerdir. İMKB-30’da yer alan hisse
senetlerinin 1990- 2009 yılları arasındaki getiri rakamları, 1960 -2009 imalat sanayi sektörler
itibariyle verimlilik rakamları, 1950- 2009 AB ülkeleri işsizlik oranları v.b.
Hem zaman hem de kesit verilerinin kullanıldığı basit bir modelde bu durum aşağıdaki
gibi gösterilir.
0 1it itC Y
Yine bu modelde i’ler yatay kesit verisini, t’ler ise zaman serisi verisini göstermektedir.
itC =t zaman noktasında i. tüketicinin belli zaman noktasındaki tüketimi,
itY = t zaman noktasında i. tüketicinin belli zaman noktasındaki gelirdir.
Buna göre panel veri setindeki n birim sayısı gösterilir iken, zaman dönemleri sayısı ise
T ile gösterilir. Örneğin 13 hisse senedinin haftalık iş günü (5) itibariyle kapanış fiyatlarına
sahip isek n=13, T=5 olmak üzere elimizde bu örnek ile ilgili n x T= 13x 5= 65 veri vardır.
Panel verinin temel özelliği, her bir mikro birimin belirli bir zaman dönemi için
gözlemlenmesidir.
Kısaca;
Zaman serisi verileri çoklu zaman dönemlerinde tek bir birim içerir.
17
Yatay-kesit verisi çoklu birim içerip tek bir zaman noktasında gözlemlenir.
Panel veri çoklu birim içerir, her birim için iki veya daha fazla zaman
noktasında gözlemlenir.
Ekonometrik modelde kullanılan veriler gelir, tasarruf, tüketim, döviz kuru, faiz oranı
gibi nicel değişken olabildiği gibi, cinsiyet, eğitim düzeyi (ilköğretim, lise, üniversite) gibi nitel
değişken de olabilir. Yine bir örnek üzerinde açıklayacak olursak; bir iş yerinde çalışanların
kazançları, işyerindeki deneyimlerine ve eğitim düzeylerine bağlıdır. Kazanca ilişkin
ekonometrik model aşağıdaki gibi yazılabilir.
0 1 1 1 2 1,....,i i i iY X X u i n , odelde;
Yi= i. çalışanın maaşı
X1=i. çalışanın işyeri deneyimi (1yıl,5yıl, 16 yıl gibi)
X2= i. çalışanın eğitim düzeyi ( lise ve üniversite)
ifade etmektedir.
n sayıda kişiye ait verilerin yer alacağı kazanç modelinde kullanılan değişkenlerde maaş
ve işyeri deneyimine ilişkin veriler nicel olmasına karşın, eğitim düzeyi nitel bir değişkendir.
Nitel değişkenler, ekonometrik modele gölge değişken yöntemi ile modele ilave edilir. (Gölge
değişkenler başlığı altında incelenecektir.)
1.5. İktisadi Veri Kaynakları
İnternetin gelişmesiyle birlikte ekonometrik uygulamalarda ihtiyaç duyulan iktisadi
verileri elde etmek oldukça kolaylaşmıştır. Türkiye ekonomisi ve diğer ülkelerin iktisadi
verilerine ulaşabilmek için aşağıdaki kurumların web sayfaları kullanılmaktadır. Türkiye
İstatistik Kurumu (TUİK), Merkez Bankası (MB) : Türkiye ekonomisi ile ilgili makro ve
finansal verilere ulaşmak mümkündür. Hazine Müsteşarlığı, Dünya Bankası, IMF ve OECD
veri tabanlarında Türkiye ve diğer ülkeler ait veriler yayınlanmaktadır.
1.6. Ekonometride Bilgisayarın ve Paket Programların Yeri
Son çeyrek yüzyılda bilgisayar teknolojisindeki gelişim, özellikle PC’lerin yaygın
kullanımı ve buna bağlı olarak ekonometrik paket programların yazılımı, ekonometrik
çalışmalara ve uygulamalara önemli ölçüde katkıda bulunmuş, ekonometrinin artan ivmesinde
önemli katkısı olmuştur. Derslerimiz ilerledikçe ekonometrik modellerin tahmini için
kullanılan matematiksel işlemlerin hiç de kolay olmadığı hep birlikte göreceğiz. Ancak paket
program aracılığı ile bu modellerin çözümü ancak birkaç dakika almaktadır.
Uygulamada en çok kullanılan programlar arasında E-Wievs, SPSS, MINITAB,
MİCRO TSP ‘yi sayabiliriz.
18
Uygulamalar
19
Uygulama Soruları
1) Aşağıdakilerden hangisi ekonometrinin bileşeni değildir?
a) İstatistik
b) Matematik
c) İktisadi istatistikler
d) Matematiksel istatistik
e) Psikoloji
2) Aşağıdakilerden hangisi ekonometrik çalışmalarda nadiren kullanılan veri
türüdür?
a) Zaman serisi verisi
b) Deneysel veri
c) Yatay kesit verisi
d) Panel veri
e) Nicel veri
3) Aşağıdakilerden hangisi panel veridir?
a) Türkiye, Yunanistan ve İsrail’in 1980-2013 yılları arasındaki yıllık savunma
harcamaları
b) 2010 girişli Ekonometri Bölüm öğrencilerinin Ekonometri Dersi final notları
c) Türkiye ekonomisi için 1990-2013 yılları arasındaki katma değer rakamları
d) 2012 yılında Türkiye’deki ilk 500 şirketin sermaye rakamları
e) AB ülkelerinin 2012 yılındaki kişi başına milli gelir rakamları
4) Aşağıdakilerden hangisi matematiksel modelin unsurlarından biri değildir?
a) Hata terimi
b) Bağımlı değişken
c) Katsayı
d) Denklem
e) Bağımsız değişen
20
5) Aşağıdakilerden değişkenlerden hangisi nitel özelliğe sahiptir?
a) Mevsim
b) Üretim
c) Ekili alan
d) Yağış miktarı
e) Çalışma süresi
6) Yatay kesit verilerinin bir özelliği değildir?
a) Ana kütleden rassal örnekleme ile edilir.
b) Çoklu birim içerir
c) Tek bir zaman noktasında gözlemlenir.
d) Nicel olmalıdır.
e) Zaman farklılıkları ihmal edilebilmektedir
7) Trend ve mevsimsellik özellikleri hangi tip verilerde kesinlikle görülmez?
a) Yatay kesit verisi
b) Panel veri
c) Zaman serisi verisi
d) Makro veri
e) Mikro veri
8) Aşağıdakilerden hangisi akım- akım ilişkisini göstermektedir?
a) Üretim- sermaye stoku
b) Katma değer-çalışma saati
c) Katma değer-sermaye stoku
d) Üretim- çalışma saati
e) Hiçbiri
21
9) “ Kişi Başına Milli Gelir rakamlarının zaman içerisinde artan bir …….. var”
ifadesinde boşluğa aşağıdakilerden hangisi gelmelidir?
a) İvmesi
b) Trendi
c) Mevsimselliği
d) Sonucu
e) Nedenselliği
10) Aşağıdakiler hangisi sadece yatay kesit verisinin kullanıldığı bir modeldir?
a) 0 1 1 1 2 1,....,i i i iY X X u i n
b) 0 1 1 1 2 1,....,t t t tY X X u t T
c) 0 1 1,...., 1,....,it it itY X u i n t T
d) 0 1 1 2 2 1,...., 1,....,it it it itY X X u i n t T
e) 0 1 1 1,....,t t tY X u t T
Cevaplar:
1 2 3 4 5 6 7 8 9 10
e e a a a d a b b a
22
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde ekonometrinin amacı, gerekliliği ve metodolojisi üzerinde durduk.
Ekonometrinin nihai hedefinin, iktisat teorisini test etmek, politika yapıcılarına bilgi vermek ve
iktisadi zaman serilerinin gelecekte alacağı değerleri öngörmek olduğunu ve bu amaç için
matematik ve istatistik yöntemlerin yoğun biçimde kullanıldığını gördük.
Ekonometrik uygulamalarda yaygın olarak zaman serisi verisi, yatay kesit verisi ve
panel verinin kullanıldığı bilgisini takiben, bu veri çeşitlerinin özelliklerini öğrendik. Zaman
serisi veri ve panel veri gibi zaman boyutunu içeren veri setlerinin, çoğu iktisadi zaman serisinin
zaman boyutu boyunca korelasyonlu olması nedeniyle trend etkisini ve günlük, aylık, üçer aylık
zaman serisi verilerinin mevsimsellik özelliğini taşıdığını gördük. Zaman serisi verilerinde
gözlemlenen trend ve mevsimsellik özelliğinin yatay kesit verisinde olmadığı, yatay kesit
verilerinin rassal örneklemeye dayandığını öğrendik. İktisadi verilerin genellikle deneysel
olmayan diğer bir ifade ile gözlemlenmiş veriler olduğu üzerinde durduk.
İktisadi verilerin hangi kaynaklardan derlenebileceğini ve bilgisayar paket programı
kullanabilmenin ekonometri açıdan önemi üzerinde durduk.
23
Bölüm Soruları
1) Aşağıdakilerden hangisi ekonometrinin nihai hedefi değildir?
a) İktisadi değişkenler için geleceğin tahmini,
b) İktisadi olayların kantitatif ölçümlerle izahını yapabilmek,
c) İktisat teorisini test etmek,
d) İktisat politikası yapıcılarına bilgi vermek,
e) Parametre tahmini yapmak
2) Aşağıdakilerden hangisi makro veri değildir?
a) Enflasyon oranı
b) Milli Gelir
c) İşsizlik oranı
d) X Bankasının yıllık karı
e) Büyüme hızı
3) Aşağıdakilerden hangisi panel veridir?
a) 1990-2013 dönemi için Türkiye’deki enflasyon oranı rakamları
b) BİST 100 ‘de işlem gören hisse senetlerinin 30 Aralık 2013 kapanış fiyatları
c) AB ülkelerinin 1998- 2013 yılları itibariyle yıllık işsizlik oranları
d) OECD ülkelerinin büyüme oranları
e) 2013 yılı mahalli seçim sonuçları
4) Aşağıdaki değişkenlerden hangisine ait veriler ulusal veya uluslararası
elektronik veri tabanlarından elde edilemez?
a) X dondurma firmasının yıllık ciro rakamları
b) Amerika Birleşik Devletlerinin savunma harcamaları
c) Türkiye’nin Gayri Safi Yurtiçi Hasılası (GSYİH)
d) Dolar/Euro paritesi
e) Almanya’nın işsizlik rakamları
24
5) Aşağıdaki ifadelerden hangisi yanlıştır?
a) Matematiksel model kesin ilişkileri, ekonometrik model stokastik ilişkileri gösterir.
b) Ekonometrik modeli matematiksel modelden ayıran en önemli unsur bünyesinde
hata terimini barındırmasıdır.
c) Ekonometri bilimi, iktisat teorisini istatistik yöntemleri kullanarak test eder.
d) Hata terimi bağımlı değişken ile bağımsız değişken arasında deterministik (kesin)
olduğunu gösterir.
e) Hata teriminin değeri model dışında belirlenir.
6) 20 kişinin gelir düzeyi ile araç sahibi olma (var/yok) arasındaki ilişkinin tespiti
için kullanılan verilerin özellikleri aşağıdakilerden hangisidir?
a) Gelir Düzeyi nicel, araba sahibi olma nitel veri
b) Gelir Düzeyi nicel, araba sahibi olma nicel veri
c) Gelir Düzeyi nitel, araba sahibi olma nicel veri
d) Gelir Düzeyi nitel, araba sahibi olma nitel veri
e) Panel veri
7) Aşağıdakilerden hangisi ekonometri ile ilgili değildir?
a) İktisat
b) Fizik
c) İstatistik
d) Matematik
e) Veri
8) Aşağıdaki değişkenlerden hangisi mevsimsellik özelliğini göstermez.
a) Turizm gelirleri
b) Gayri Safi Yurtiçi Hasıla
c) Zirai Üretim
d) Turist sayısı
e) Savunma harcamaları
25
9) Bir işletmede çalışanların kazançlarının ( lira ), işyeri deneyimi (yıl), eğitim
düzeyi (ilköğretim, lise, üniversite) ve cinsiyetin (kadın-erkek) fonksiyonu olduğu
bilinmektedir. Buna göre bu işletmede 2016 yılı için çalışanların kazançları tahmin
edilmek istenirse kullanılan veri türü aşağıdakilerden hangisidir.
a) Zaman serisi verisi
b) Panel veri
c) Yatay kesit verisi
d) Makro veri
e) Stok veri
10) Feldstein-Horioka hipotezine göre bir ülkenin yurt içi tasarruf (S) ve
yatırımlarının (I) GSYİH’ya oranları arasındaki ilişki, uluslararası sermaye hareketliliği
hakkında bilgi vermektedir. Feldstein ve Horioka (1980) tam sermaye hareketliliğinden
bahsedebilmek için bu iki değişken arasında anlamlı bir ilişkinin olmaması gerektiği
savunmuşlardır. Buna göre Türkiye için Feldstein-Horioka hipotezini test etmek
amacıyla kullanılacak ekonometrik model aşağıdakilerden hangisidir?
a) 0 1 1,...,t t tI S u t T
b) 0 1/ / 1,...,t t t t tI GSİH S GSİH u t T
c) 0 1/ / 1,...,i i i iI GSİH S GSİH i N
d) 0 1 1,...,i iI S i N
e) 0 1/ / 1,...,t t t t tGSİH I GSİH S u t T
Cevaplar
1. e
2. d
3. c
4. a
5. d
6. a
26
7. b
8. e
9. c
10. b
27
2. REGRESYON ANALİZİNE GİRİŞ
28
Bu Bölümde Neler Öğreneceğiz?
2.1. Regresyon Analizine Giriş
2.2. Regresyon ve Korelasyon
2.3. Ana Kütle Regresyon Modeli
2.4. Hata Teriminin ( Rassal Hata) Tanıtılması
2.5. Örnek Regresyon Modeli
2.6. Hata Terimin Kaynakları
29
Bölüm Hakkında İlgi Oluşturan Sorular
1) Regresyon analizi ne amaçla kullanılır?
2) Regresyon analizi ile korelasyon analizi aynı amaçla kullanılabilir mi?
3) Ana kütle regresyon modeli ile örnek regresyon modeli aynı mıdır?
4) Niçin örnek rgresyon modelini tahmin ederiz?
5) Rassal hata (hata terimi) ne amaçla modele dahil edilir?
30
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde edileceği
veya geliştirileceği
Regresyon analizinin amacı
İktisadi değişkenler
arasındaki ilişkinin
matematiksel kalıpla
ifade edilebileceği
Ders notları
Koşullu olasılık, koşullu
ortalama (beklenen değer)
koşullu varyans
Ana kütle regresyon
modelini kavramak
Ders notları, Uygulamaları
tekrar ederek, verilen soruları
cevaplandırarak
Regresyon ve korrelasyon
Regresyon ile
korelasyonun benzer ve
farklı yönlerini nedenleri
ile kavrabilmek
Ders notları
Ana kütle regresyon modeli
ve örnek regresyon modeli
Ana kütle regresyon
modeli ile örnek
regresyon modelinde yer
alan unsurları öğrenmek
ikisi model arasındaki
farklılığı anlamak
Ders notları
Hata terimi, kalıntı Ekonometrik modelin
özünün benimsenmesi
Ders notları, Uygulamaları
tekrar ederek, verilen soruları
cevaplandırarak
31
Anahtar Kavramlar
Rassal değişken
Koşullu olasılık
Koşulu ortalama (beklenen değer)
Koşullu varyans
Ana kütle regresyon modeli
Ana kütle regresyon doğrusu
Örnek regresyon modeli
Örnek regresyon modeli
Nedensellik
Regresyon
Korelasyon
Rassal hata (hata terimi)
Kalıntı
Serpilme diyagramı
32
Giriş
Bu bölüm regresyon analizin temelini oluşturmaktadır. Derslerimiz ilerledikçe devamlı
tahminden bahsedeceğiz. Parametreleri tahmin edeceğiz, rassal hatanın varyansını tahmin
edeceğiz. “Peki bu tahmin edilenlerin gerçek değerleri nelerdir?” sorusuna cevabımız “Bunları
hiçbir zaman bilemeyiz” olacaktır. Ancak Gujarati ’nin “Temel Ekonometri ” kitabının ilk
bölümü bize bilmediğimiz ana kütleyi tanıtmak amacıyla iyi bir okuma sunmaktadır.
Bu bölümde verilen kavramların çok iyi özümsenmesi gerekmektedir. Ana kütle, örnek
kütle kavramlarının ve unsurlarını özümsemeden diğer bölüme geçmemelisiniz.
Bölümün sonundaki EK 2,1’de bölümdeki veriler kullanılarak ana kütle regresyon
modeli oluşturulmuştur. Amaç ileriki derslerimizde tahmin edilen örnek regresyon doğrusuyla
neyi tahmin ettiğimizi daha iyi anlamak amacıyla sadece yol gösterici olması açısından
verilmiştir.
33
2.1. Regresyon Analizine Giriş
Regresyon kavramı ilk kez, anne-babaların boyları ile çocuklarının boyları arasındaki
ilişkiyi dikkate alan çalışmasında, İngiliz istatistikçi Sir Francis Galton (1822-1911) tarafından
kullanılmıştır. Galton, çalışmasında uzun boylu anne-babaların uzun boylu, kısa boylu anne-
babaların kısa boylu çocuklara sahip olma beklentisi karşısında, çocukların boylarının
uzunluklarının ortalama boy uzunluğuna yaklaşma eğiliminde olduğunu göstermiştir.
Günümüzde kullanılan anlamı ile regresyon, değişkenler arasındaki ilişkilerin
incelenmesidir. Regresyon analizi ile bir veya birden fazla değişkenin (bağımsız değişken)
değerindeki değişmelerin başka bir değişkenin (bağımlı değişken) değeri üzerindeki etkileri
araştırılmaktadır. Regresyon bağımlı ve bağımsız değişkenler arasında ilişki kuran
parametrelerin değerinin tahmin imkânı araştıran istatistiksel bir yöntemdir.
Bir regresyon modelinin kurulabilmesi için önsel olarak;
1. Sebep-sonuç ilişkisine göre bağımlı ve bağımsız değişken ayrımının,
2. Modelde yer alacak bağımsız değişkenlerin,
3. Modelin fonksiyonel biçiminin
belirlenmesi gerekir. Ancak sebep-sonuç ilişkisi ekonometride regresyonun dışında
olup, çoğu kez iktisat kuramı tarafından saptanmaktadır.
Ekonometri konularıyla ilgili literatürde en çok rastlanan ve ilgi gören model türü tek
denklemli doğrusal regresyon modelleridir. 1980 sonrası teorik ve uygulamalı ekonometrideki
hızlı gelişme ile birlikte iktisadi gerçekler ve veriler daha komplike modeller ile izah
edilebiliyorsa da, tek denklemli doğrusal modeller ekonometrik analizlerde hala önemli bir yer
tutmaktadır. Bunun sebepleri:
1. Geleneksel iktisat teorisi, bir sonucu bir dizi sebebe bağlamakta ve bunu tek
denklemli bir model çerçevesinde ele alan bir tutuma sahip bulunmaktadır.
2. Gerçekler çok defa basit kalıplara sokulamayacak kadar karmaşık olmasına rağmen,
iktisadi olaylarda sebep-sonuç ilişkilerinin doğrusal bir model içinde sunulması önemli ölçüde
kolaylık sağlamaktadır.
Tek denklemli doğrusal regresyon modellerinde yalnız bir bağımlı değişken vardır ve bu
bağımlı değişken bir ya da birden çok bağımsız değişkenin doğrusal fonksiyonu olarak
tanımlanmıştır.
Tek denklemli doğrusal regresyon modellerinde bağımsız değşken/değişkenlerden
bağımlı değişkene doğru tek yönlü bir ilişkinin olduğu varsayılmaktadır. Modelin bağımsız
kabul edilen değişken(ler)i, modelin bağımlı değişkeni tarafından etkilenmeyecektir. Diğer bir
ifade ile sistemde geri tepme (feedback) ve karşılıklı ilişki olmayacaktır. Regresyon modelleri
nedensellik ilişkisi üzerine kurulur. Nedensellik ilişkisi kuramsal ve önsel (a’priori) olmalı,
34
kısaca iktisat teorisi tarafından belirlenmelidir. İstatistiksel açıdan anlamlı bir ilişki, kendi
başına bir nedensellik ilişkisi anlamı taşımaz.
İktisadi ilişkilerin ölçülmesinde ilk adım, iktisadi ilişkileri yansıtan modellerde yer
alacak değişkenlerin tanımlanmasıdır. Bir ana kütlenin veya ondan çekilecek bir örneğin
birimleri bir veya birden çok özelliği bakımından gözlemlenebilir. Bu özellikler nicel ve/veya
nitel olabilir.
Modelde yer alan bağımsız değişken sayısına göre regresyon modelleri basit regresyon
ve çok değişkenli regresyon olmak üzere ikiye ayrılır. Bağımlı değişken sadece bir bağımsız
değişken tarafından açıklanıyorsa basit regresyon modeli, birden fazla değişken tarafından
açıklanıyorsa çok değişkenli regresyon modeli söz konusudur.
İlişkileri mümkün olduğu kadar basitleştirebilmek için, tek yönlü bir ilişki üzerinde
durulan ve bu ilişkinin de bağımlı ve bağımsız değişken olmak üzere sadece iki değişkeni
içerdiği şeklindeki varsayımdan hareketle, en basit durum basit regresyon modeli;
0 1 1,2......i i iY X u i n
ile gösterilirken, birden fazla bağımsız değişkenin yer aldığı çok değişkenli regresyon modeli;
0 1 1 2 2 .......... 1,2......i i i k ki iY X X X u i n
gibi gösterilir. Yukarıdaki modellerde de görüldüğü üzere, basit regresyon modelinde bağımlı
değişkeni açıklayan sadece bir tane bağımsız değişken (X) yer alırken, çok değişkenli regresyon
modelinde birden fazla k sayıda bağımsız değişken (X1,X2...........Xk ) vardır. i ise 1’den n’e kadar
olan gözlemleri ifade etmektedir. Her iki modelde de sadece tek bir bağımlı değişken (Y) yer
almaktadır.
Örneğin, bir malın talebi (D) en basit ifade ile malın fiyatının (P) fonksiyonudur. Malın
fiyatı artarsa malın talebi düşer, malın fiyatı düşerse de talebi artar. Fiyattan talebe doğru bir
nedensellik söz konusu olduğuna göre, talep bağımlı değişken, fiyat ise bağımsız değişkendir.
Buna göre basit regresyon modeli aşağıdaki gibi kurulacaktır.
1 2 1,2......t t tD P u t T
Ancak bir malın talebi, malın fiyatının yanı sıra bu malı talep eden kişilerin gelir
düzeyine (Y), malın tamamlayıcı malı varsa bu tamamlayıcı malın fiyatına (PT) ve nihayet rakip
mal varsa rakip malın fiyatına (PR) bağlı olarak değişkenlik gösterecektir. İlgili değişkenler
modele dahil edildiğinde, model çok değişkenli regresyon modeli olarak adlandırılacak ve
aşağıdaki şekilde gösterilecektir.
0 1 2 3 4 1,2......t t t Tt Rt iD P Y P P u t T
35
Yukarıdaki çok değişkenli regresyon modelinde malın talebi dört tane bağımsız değişken
ve hata teriminin (veya rassal hatanın-ui) doğrusal bir fonksiyonudur. Talep modelinin tahmini
ile gelir esnekliği ve çapraz esneklikleri tahmin etmek mümkün olacaktır.
Regresyon analizinde, değişkenler arasındaki ilişki fonksiyonel ya da kesin ilişkiler
olmayıp istatistiksel ilişkilerdir. Değişkenler arasındaki istatistiksel ilişkilerde, genellikle
stokastik (tesadüfi-rastlantısal) değişkenler yani olasılık dağılımı olan değişkenler kullanılır.
Regresyon analizinde de bağımlı değişken stokastik bir değişkendir. Fonksiyonel ya da kesin
ilişkilerde de değişkenler kullanılır, ancak bunlar tesadüfi ya da stokastik değil, deterministik
değişkenlerdir.
2.2. Regresyon ve Korelasyon
Regresyon analizi, korelasyon ile yakından ilişkili, ancak kavramsal olarak çok farklıdır.
Regresyonun korelasyona benzer yanı ikisinin de değişkenler arasında birlik ve beraberliği
aramalarıdır. Aralarındaki fark ise, regresyonun bir sebep-sonuç ilişkisi içinde yani nedensellik
ilişkisi içinde değişkenler arasındaki bağlantıyı aramasına karşılık, korelasyon analizi bu
şekilde bir sebep-sonuç ilişkisi olmadan, değişkenler arasındaki doğrusal ilişkinin yön ve
derecesinin saptanmasını sağlar.
Basit korelasyon analizinin amacı, yukarıda da ifade edildiği üzere iki değişken
arasındaki doğrusal ilişkinin yönünü ve derecesini ölçmektir. İstatistik dersinden hatırlanacağı
üzere basit korelasyon katsayısı
2 2
i i
i i
x yr
x y
formülü ile hesaplanmaktadır. Formülde yer alan unsurlar ise ,i i i ix X X y Y Y 'e eşittir.
Basit korelasyon katsayısı (r), 1 1r değerleri arasında yer alır. Regresyon analizinde ise
bağımlı değişkenin ortalama değeri, bağımsız değişken(ler)in değişmeyen değerlerine
dayanılarak tahmin edilmektedir.
Regresyon analizinde bağımlı ve bağımsız değişkenlerin ele alınmasında sebep-sonuç
ilişkisinden dolayı asimetri söz konusudur. Bağımlı değişkenin istatistiksel, tesadüfi olduğu
yani olasılık dağılımı bulunduğu varsayılır. Bu varsayım X bağımsız değişkeninin sabit bir
değeri için ana kütlede bağımlı değişkenin en az iki farklı değerinin bulunduğu anlamına
gelmektedir. Örneğin aynı gelir düzeyine sahip iki hane halkı reisinin aynı tüketim
harcamasında bulunmasını bekleyemeyiz. 1000 lira geliri olan bir aile reisi 950 lira tüketim
harcaması yapıyorken, aynı (1000 lira) gelire sahip olan bir başka aile reisi 650 lira tüketim
harcaması yapabilir. Tesadüfi ilişkinin bir gereği olan bu durum bir dağılım oluşturacaktır.
Öte yandan bağımsız değişkenlerin yenilenen örneklemlerde değişmeyen değerler aldıkları
varsayılmaktadır. Korelasyon analizinde herhangi iki değişkeni simetrik olarak ele alabiliriz.
Bağımlı ve bağımsız değişken ayrımı yoktur. Her iki değişkenin de tesadüfi olduğu
varsayılmıştır.
36
2.3. Ana kütle Regresyon Modeli
Regresyon analizi büyük ölçüde, bağımsız değişkenin değeri bilindiği ya da sabit olduğu
durumda bağımlı değişkenin ana kütledeki ortalama değeri ile ilgilenir. Regresyon analizine
başlangıç olarak basit regresyon modeli incelenecektir.
Basit regresyon modeli, bağımlı Y değişkeni ile bağımsız X değişkeni arasında bağlantı
sağlamaktadır. X’in her sabit değeri için rastlantısal ilişki gereği ana kütlede bağımlı değişkenin
en az iki farklı değerinin bulunması zorunludur. Böylece her iX değişkeni için farklı Y değerleri
elde edilecek, bu da bir dağılım oluşturacaktır.
Rastlantısal ilişkiyi açıklayabilmek için belirli bir zaman boyutu içinde, hane halkları
yatay kesitinde hipotetik veriler kullanılarak haftalık gelir ile haftalık tüketim harcamaları
arasında ilişki incelenecektir. Tüketim harcamaları, gelirin bir fonksiyonudur. Buna göre, X
haftalık gelir, Y ise tüketim harcamalarıdır. Öncelikle 60 aileden oluşan ana kütle, gelirleri
yaklaşık olarak aynı olan ailelerden oluşan 10 ayrı gruba ayrılır ve alt ana kütle olarak
adlandırılan her grup, aynı gelir düzeyindeki farklı ailelerin tüketim harcamalarını gösterir.
n=60 aile
Xi= Haftalık gelir ( birimi 100 lira)
Yi= Haftalık tüketim harcamalarını (birimi 100 lira) göstermektedir.
( Örneğin tablodaki 80 ile gösterilen gelir 8000 lirayı, 65 ile gösterilen tüketim harcaması ise
6500 lirayı ifade etmektedir.)
Xi 80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
Yij 65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 189 185
115 162 191
ni 5 6 5 7 6 6 5 7 6 7
Toplam 325 462 445 707 678 750 685 1043 966 1211
Kaynak: Gujarati
Tablo-2.1: Haftalık harcanabilir gelir ve tüketim harcaması
Tablo 2.1’deki her bir sütun alt ana kütle olarak adlandırılmakta ve sabit bir X
değerlerine karşılık gelen Y bağımlı değişkeninin koşullu dağılımını vermektedir. Buna göre,
yukarıdaki her bir sütun belli bir gelir düzeyine karşılık gelen tüketim harcamalarının koşullu
dağılımını verecektir. Tablodan da açıkça görüleceği üzere, belirli bir gelir düzeyine sahip (X)
bir gruba ait tüm hane halklarının aynı tüketim harcamasında (Y) bulunması beklenemez. Diğer
bir ifade ile bağımsız değişkenin (gelir) sabit değerine karşın bağımlı değişkenin (tüketim)
birbirinden farklı değerleri vardır. Örneğin, 80 lira haftalık gelire sahip 5 aile, 55, 60, 65, 70 ve
37
75 lira olmak üzere farklı tüketim harcamalarında bulunmaktadır. Bu farklı tüketim harcamaları
bir olasılık dağılım oluşturmaktadır.
Haftalık harcanabilir gelir (X) 80 lira iken birbirinden farklı 5 tane haftalık tüketim
harcaması olduğuna göre, bunların her birinin gerçekleşme olasılığı 1/5’dir. Diğer bir ifade ile
80 lira geliri olan 5 aileden oluşan bir alt ana kütleden rastlantısal olarak seçilen bir ailenin 55
lira haftalık tüketim harcaması olan aile olmasının koşullu olasılığı 1/5 ’e eşittir ve aşağıdaki
gösterilir:
55 80 1/ 5P Y X
Diğer bir alt ana kütle için örnek verecek olursak, haftalık harcanabilir geliri 220 lira
olan 7 aile vardır. Bu ailelerin tüketimleri birbirlerinden farklıdır ve her birinin gerçekleşme
olasılığı 1/7’dir. Buna göre 220 lira haftalık geliri olan 7 aileden oluşan bir alt ana kütleden
rastlantısal olarak seçilen bir ailenin 157 lira haftalık tüketim harcaması olan aile olmasının
koşullu olasılığı 1/7’ye eşittir ve aşağıdaki gibi gösterilir.
157 220 1/ 7P Y X
Bu uygulamada alt ana kütlelerin birim mevcutları farklıdır. Alt ana kütle birim
mevcutlarının aynı olması halinde, ana kütle içinde bütün alt ana kütlelerin koşullu olasılıkları
aynı olacaktır.
Her alt ana kütledeki ailelerden bazıları daha fazla, bazıları daha az harcarlarsa da
harcama rakamlarının söz konusu gelir düzeyini hedef alan bir değer etrafında toplanmaları
beklenebilir. Böylece olasılık dağılımlı her alt ana kütle için beklenen değer ya da koşullu
ortalama i iE Y X X (kısaca i iE Y X veya E Y ile gösterilir) hesaplanır. Beklenen
değer (koşullu ortalama) X veri iken Y rastlantısal değişkeninin çok sayıda veya meydana
gelişte alacağı değerlerin ortalamasıdır. Beklenen değerin hesaplanabilmesi için, Y’nin her alt
ana kütle için koşullu olasılıklarının bilinmesi gerekir. Beklenen değer iX ’nin doğrusal bir
fonksiyonudur.
i i i i ii iE Y X X Y P Y Y X X Y P Y X
Buna göre X=80 lira iken Y’nin koşullu ortalaması veya diğer bir ifade ile beklenen
değeri:
1 1 1 1 1
80 55 60 65 70 755 5 5 5 5
1 1(55 60 65 70 75) 325 65
5 5
E Y X
80 65E Y X
38
olarak hesaplanır. Kısaca aynı 80 lira gelir seviyesindeki 5 ailenin birbirinden farklı tüketim
harcamalarının koşullu ortalaması (beklenen değeri) 65 liraya eşittir.
Diğer bir alt ana kütle, X=220 lira iken Y’nin koşullu ortalaması veya beklenen değeri:
1 1 1 1 1 1 1220 135 137 140 152 157 160 162
7 7 7 7 7 7 7
1 1(135 137 140 152 157 160 162) 462 149
7 7
E Y X
220 149E Y X
olarak hesaplanır. Böylece 10 alt ana kütle için 10 tane koşullu ortalama (beklenen değer)
hesaplanacaktır. Haftalık gelir ve tüketim harcamaları için hesaplanan koşullu olasılık ve
koşullu ortalamalar Tablo-2.2’de yer almaktadır.
Xi 80 100 120 140 160 180 200 220 240 260
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
P Y X 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/6 1/7 1/6 1/6 1/7 1/6 1/7
1/7 1/7 1/7
E Y 65 77 89 101 113 125 137 149 161 173
( )Var Y 50 66 46.4 133.42 57.3 116.6 82.4 112 310.7 216.5
Tablo-2.2: Koşullu Olasılıklar, Koşullu Ortalamalar ve Koşullu Varyanslar
Her alt ana kütlenin bir dağılımı olduğuna göre, alt ana kütlelerin koşullu varyansları ve
dolayısıyla standart sapmaları hesaplanabilir. Bilindiği üzere varyans ve standart sapma olasılık
dağılımının dağılışını diğer bir ifade ile yayılımını ölçer. Alt ana kütle koşullu varyansı
aşağıdaki gibi hesaplanmaktadır.
2
22 1( )
n
i i i
ii i i i
Y E Y X X
Var Y E Y E Y X Xn
Örneğin X=80 iken Y’nin koşullu varyansını hesaplayalım. Gelir 80 liraya eşit iken,
tüketim harcamalarının koşullu ortalamasının ( 80 65E Y X ) 65 lira olduğu bilindiğine
göre, X=80 iken Y’nin koşullu varyansı
2 2
2 2 2 2 2
80 65
(55 65) (60 65) (65 65) (70 65) (75 65)50
5
i iE Y E Y X E Y
39
olarak hesaplanır. Hesaplanan Y’nin koşullu varyansı - 2
80 50iE Y E Y X -, hane halkı
tüketim harcaması Y’nin ortalama- 80 65E Y X -etrafında yayılımını ölçer.
Aynı şekilde X=100 iken Y’nin koşullu varyansı ise;
2 2
2 2 2 2 2 2
100 77
(65 77) (70 77) (74 77) (80 77) (85 77) (88 77)66
6
i iE Y E Y X E Y
olarak hesaplanır. Diğer alt ana kütle için hesaplanan koşullu varyans değerleri Tablo 2.2’de
verilmiştir. Hesaplamalara göre alt ana kütle varyanslarının farklı olduğu sonucuna varılmıştır
(Dikkat bu sonuç homoskedasite–eşit varyans varsayımında kullanılacaktır.)
Ana kütle regresyon doğrusu, iX veriyken Y’nin ana kütle ortalama dağılımının iX ile
fonksiyonel ilişkili olduğunu gösterir. Yani X’ deki değişmeye karşılık Y’nin ortalama tepkisini
gösterir. Böylece, ana kütle regresyon fonksiyonu,
1 2 iE Y X X
şeklinde ifade edilmektedir. Ana kütle regresyon fonksiyonunda yer alan 1 ve 2 modelin
bilinmeyen parametreleridir. 1 sabit terim veya kesim parametresi,
2 ise eğim parametresi
olarak adlandırılır. 1 parametresi, ana kütle regresyon doğrusunun koordinat sisteminde Y
eksenini kestiği nokta, 2 ise ana kütle regresyon doğrusunun eğimidir. 2 , X bağımsız
değişkenindeki 1 birimlik değişme gerçekleştiğinde ( | )iE Y X deki değişme miktarını, diğer bir
ifade ile marjinal değişmeyi göstermektedir ve aşağıdaki gibi ifade edilmektedir.
2
( | ) ( | )i iE Y X dE Y X
X dX
Regresyon analizinde doğrusallıktan kasıt, Y nin beklenen değerinin parametrelerin
doğrusal bir fonksiyonu olmasıdır. 1 ve
2 parametrelerinin üstlerinin 1 olması dolayısıyla
model doğrusaldır. Hem parametreler hem de değişkenler açısından doğrusal olan regresyon
modelleri birinci mertebeden regresyon modelleri olarak adlandırılır.
2
1 2 iE Y X X
40
İkinci dereceden doğrusal bir regresyon modelidir. Bağımsız değişkenin üstlerinin azamisi
modelin mertebesini verir.
BASİT REGRESYON MODELİNİN VARSAYIMLARI-I
1. X’in her değeri için, Y’nin ortalama değeri aşağıdaki doğrusal regresyon
fonksiyonu ile elde edilir.
1 2 iE Y X X
2. X’in bir değeri için Y’nin gözlemlenen değerleri, ortalama değerleri etrafında
dağılır ve aynı varyansa sahip olasılık dağılımları izler.
2
2( )i i iE Y E Y X X Var Y X
3. Y’nin örnek değerlerinin hepsi korelasyonsuz ve sıfır kovaryansa sahiptir.
Bu varsayım Y’ler arasında doğrusal bir birlikteliğin olmadığı anlamına gelir.
, 0i jCov Y Y i j
4. X rassal değişken değildir ve en azından iki farklı değer almak zorundadır.
X’in rassal olmadığı varsayımı, X’in değerinin bilindiği anlamına gelir. İstatistikte bu tür X
değerlerinin, “tekrarlanan örneklerde sabit” olacağı anlamına gelir. En az iki farklı değer
alması ( ) 0Var X anlamına gelir.
5. X’in her değeri için, Y değerleri ortalama etrafında normal dağılır. (isteğe
bağlı)
2
1 2 ,iY N X
Hata Teriminin (Rassal Hata) Tanıtılması
Regresyon analizinin özü, bağımlı değişken Y ile ilgili herhangi bir gözlemin, sistematik
bileşen ve rassal bileşen olarak iki kısma ayrılabilmesidir. Y’nin sistematik bileşeni, kendi
ortalamasıdır, 1 2 iE Y X X . Bu ortalama matematiksel bir beklenti olduğu için rassal
değildir. Y’nin rassal bileşeni, Yi ile koşullu ortalama değeri ( | )iE Y X arasındaki farktır. Rassal
hata terimi (iu ) olarak adlandırılan bu fark aşağıdaki gibi tanımlanmaktadır.
1 2 1 2( | )i i i i i iu Y E Y X Y X Y X
Yukarıdaki eşitliğine göre hata terimi, bağımlı değişkenin gözlemlenen değeri ile
beklenen değeri arasındaki farka eşittir. Hata terimi eşitliği yeniden düzenlenirse, aşağıdaki
basit doğrusal regresyon modeli elde edilir.
41
1 2i i iY X u
Böylece bağımlı değişken iY , bağımsız değişken
iX ve rassal hata terimiiu ’nin
sistematik olarak değişen bir bileşimi ile açıklanır.
Bu bağlamda birinci ve ikinci alt ana kütleler için hata terimleri aşağıdaki hesaplanır.
Xi=80 Xi=100
u1=55-65= -10 u1= 65-77= -12
u2=60-65= -5 u2=70-77= -7
u3=65-65= 0 u3=74-77= -3
u4=70-65= 5 u4=80-77=3
u5=75-65= 10 u5=85-77= 8
u6=88-77=11
Diğer 8 alt ana kütle için hata terimlerinin hesaplanması okuyucuya bırakılmıştır.
Yukarıda görüldüğü üzere X=80 lira iken, hata terimi -10,-5, 0, 5 ve 10 olmak üzere 5 farklı
değer almıştır.
( | )i i iu Y E Y X ve bu bağlı olarak yukarıdaki hesaplamalara göre iY ve hata terimi
iu ’nin, sadece rassal olmayan 1 2 iE Y X X terimi ile farklılık gösterdiği
görülmektedir. Buna göre Y rassal olduğu için hata terimi u’da rassal olacaktır.
Dolayısıyla hata terimi de bağımlı değişken Y gibi olasılık dağılımlıdır ve hata teriminin
de koşullu ortalaması ve koşullu varyansı hesaplanır. Hata teriminin beklenen değeri( koşullu
ortalaması) aşağıdaki gibidir.
1 2( | ) 0i i iE u X X E Y X X X
X veri iken rassal hata terimi iu , artı ve eksi değer alabilen gözlenemeyen bir
değişkendir ve hata teriminin ortalama değeri sıfırdır.
Bu aşamada verilen ana kütle ilgili hata terimlerinin ortalama değerlerini ve
varyanslarını hesaplayalım.
X=80 lira iken her bir hata teriminin koşullu olasılığı 1/5 ’e eşittir.
10 80 5 80 0 80
5 80 10 0 1 58
P u X P u X P u X
P u X P u X
42
Böylece X=80 lira iken hata teriminin koşullu ortalaması;
1 1 1 1 180 ( 10) ( 5) 0 5 10
5 5 5 5 5
1( 10) ( 5) 0 5 10 0
5
E u X
X=80 lira iken hata teriminin koşullu varyansı ise ;
2 2
2 2 2 2 2
80 0
( 10 0) ( 5 0) (0 0) (5 0) (10 0)50
5
i iE u E u X E u
olarak hesaplanmıştır. Benzer şekilde X=100 lira iken elde edilen hata terimine ilişkin olasılık
dağılımının koşullu ortalama ve koşullu varyansını da hesaplayabiliriz. Öncelikle X=100 lira
iken her bir hata teriminin koşullu olasılığı 1/6 ‘ ya eşittir.
12 100 7 100 3 100
3 100 8 100 11 100 1 6
P u X P u X P u X
P u X P u X P u X
Böylece X=100 lira iken hata teriminin koşullu ortalaması;
1 1 1 1 1 1100 ( 12) ( 7) ( 3) 3 8 11
6 6 6 6 6 6
1( 12) ( 7) ( 3) 3 8 11 0
6
E u X
X=100 lira iken hata teriminin koşullu varyansı ise;
2 2
2 2 2 2 2 2
100 0
( 12 0) ( 7 0) ( 3 0) (3 0) (8 0) (11 0)66
6
i iE u E u X E u
olarak hesaplanmıştır.
Burada dikkat dikkat edilmesi gereken iki önemli sonuç vardır.
1. Hata teriminin koşullu ortalaması (beklenen değeri) sıfıra eşittir. Diğer 8 alt ana kütle
için hesaplamalar okuyucuya bırakılmıştır. Bu hesaplamalar yapıldığında her alt ana
kütle için hata teriminin koşullu ortalamasının sıfır olduğu görülecektir.
43
2. Hata teriminin koşullu varyansı ile bağımlı değişken Y ‘nin koşullu varyansı her alt
ana kütle için eşittir. Burada da diğer 8 alt ana kütle için hesaplamalar okuyucuya
bırakılmıştır.
2 2
80 80 50i iE Y E Y X E u E u X
2 2
100 100 66i iE Y E Y X E u E u X
Y ve u yalnızca bir sabit ( yani, rassal olmayan bir faktör) ile farklılık gösterdiği için,
varyansları özdeş veya 𝜎2‘ye eşit olması gerekir. Buna göre; hata terimi ile bağımlı değişken
aynı dağılıma sahiptirler. Ancak dağılımın ortalamaları farklıdır. Hata teriminin koşullu
ortalaması sıfır - 0iE u X X -iken, bağımlı değişkenin koşullu ortalaması 1 2 iX ’dır -
1 2i iE Y X X X -.
Şekil 2.1. Y ve u için olasılık yoğunluk fonksiyonları
44
Basit regresyon modelinin hata terimi iu varsayımları aşağıdaki gibidir.
BASİT REGRESYON MODELİNİN VARSAYIMLARI-II
6. X’in her değeri için, Y’nin değeri:
1 2i i iY X u
7. Rassal hata iu ’nin beklenen değeri,
0i iE u X
Bu varsayım 1. varsayıma eşdeğerdir, 1 2 iE Y X X .
8. Rassal hata iu ’nin varyansı sabittir. (Bu varsayım homoskedasite/eşit varyans
olarak adlandırılmakta olup, ilerleyen derslerimizde detaylı ele alınacaktır.)
2 2
2
i i i iE Y E Y X X E u E u X X 2( )i iVar u Var Y
Rassal değişkenler Y ve u , aynı varyansa sahiptirler.
9. Rassal hatalar iu ve ju nin herhangi bir çifti arasındaki kovaryans,
, , 0i j i jCov u u Cov Y Y
Bu varsayımın daha güçlü biçimi, rassal hatalar iu ’nin istatistiksel olarak bağımsız
olması halidir. Bu durumda bağımlı değişken Y’nin değerleri de istatiksel olarak bağımsızdır.
(Bu varsayımdan sapma otokorelasyon olarak adlandırılmakta olup, ilerleyen derslerimizde
detaylı ele alınacaktır.
10. iu değerleri, ortalamaları etrafında normal dağılır.(isteğe bağlı)
20,iu N
Y değerleri normal dağılırsa hata terimleri de normal dağılacaktır.
Özet ile bağımlı değişken Yi’nin bileşenleri ile ilgili özellikler:
Sistematik bileşen (1 2 iX ); alt ana kütle ortalamalarından geçen bir doğru olup ana
kütle regresyon doğrusu olarak adlandırılır ve aşağıdaki gibi gösterilir.
1 2 iE Y X X
Ana kütle regresyon fonksiyonunda yer alan unsurlardan 1 , X=0 olduğunda Y’nin beklenen
değerine eşittir.
1 ( | 0)E Y X
45
Ancak 1 ’ın bu açıdan yorumlanması, X’in 0 etrafında veri bulunmasına bağlıdır. Aksi halde
bu yorum geçerli değildir. 1 , genel olarak modelde yer almayan ancak bağımlı değişken
üzerinde etkili olduğu bilinen değişkenlerin ortalama etkisini göstermektedir.
2 , yukarıda da değinildiği üzere, X' teki bir birimlik değişme karşısında Y’nin beklenen
değerindeki ( | )iE Y X değişme miktarını, diğer bir ifade ile marjinal değişmeyi verir. 2 aynı
zamanda ana kütle regresyon doğrusunun eğimidir.
2
( | ) d ( | )
d
i i
i i
E Y X E Y X
X X
Şekil 2.2 İktisadi model: haftalık gelir ve tüketim harcamaları arasındaki ilişki
Stokastik bileşen hata terimlerini simgeleyen iu , bağımlı değişkenin gözlemlenen
değeri (iY ) ile bağımlı ve bağımsız değişken arasında ortalama ilişkiyi gösteren (
1 2 iX )
kısım arasındaki farka eşittir. Alt örnekler itibariyle dikkate alındığında, hata terimi her alt ana
kütlenin birimlerinin alt ana kütle ortalamasından sapmalarını göstermekte, eğer ( | )i iY E Y X
ise artı, ( | )i iY E Y X ise eksi değer almaktadır.
iu , bağımlı değişken ( iY ) ile aynı özellikleri göstermesine rağmen gözlemlenemeyen
rassal değişkendir.
i i i iY E Y X u burada 1 2 iE Y X X olduğuna göre
1 2i i iY X u
Hata terimi, rastlantısal bir değişken olduğuna göre bağımlı değişken (Y) gibi hata terimi
de olasılık dağılımına sahiptir ve dolayısıyla koşullu ortalaması (beklenen değeri) ve koşullu
varyansı hesaplanabilir.
Ana kütle regresyon doğrusunun bağımlı değişkenin beklenen değerlerinden geçtiği
varsayımı, hata terimlerinin beklenen değerlerinin sıfır olduğu anlamına gelmektedir.
46
Şekil-2.1: Ana kütle Regresyon Fonksiyonu
Yukarıdaki şekilde görüldüğü üzere; n sayıdaki (yukarıdaki örnekte n 60’a eşittir.) Y ve
X gözlem çiftleri bir dağılım diyagramı üzerinde gösterilebilir ki biz bunu serpilme diyagramı
olarak adlandırıyoruz. Geometrik olarak ana kütle regresyon doğrusu, açıklayıcı değişkenlerin
sabit değerlerine karşılık gelen bağımlı değişkenin koşullu ortalamalarından (beklenen
değerlerinden) geçmektedir.
Örnek Kütle Regresyon Modeli
Uygulamada ana kütlenin gözlemlenememesi ve dolayısıyla 1 2 iX doğrusunun
bilinmemesi nedeniyle, ana kütle yerine çoğu kez örnekten hareket edilmektedir. 1 , 2 ve
hata teriminin varyansı (2 ) bilinmeyen parametrelerdir. Bu parametreler ana kütle verileri
yerine örnek gözlemlerine dayanılarak istatistiksel olarak tahmin edilir. Genellikle X’ in sabit
değerleri için, Y ’nin örnekleme değerleri bulunmaktadır.
47
Yukarıdaki ana kütleden rastlantısal çekilen iki örneğe ait veriler aşağıdaki gibidir.
ÖRNEK 1 ÖRNEK 2
Y X Y X
65 80 55 80
80 100 74 100
79 120 90 120
113 140 103 140
125 160 107 160
115 180 135 180
144 200 144 200
157 220 160 220
155 240 189 240
178 260 150 260
Yukarıdaki iki farklı örneklemde görüldüğü üzere X’in değeri, tekrarlanan
örneklemlerde değişmemekte, sabit kalmaktadır. Ancak Y stokastik (rastlantısal) bir değişken
olduğu için X’ in sabit her bir değerine birden fazla Y değeri karşılık gelmekte ve dolayısıyla
yukarıda da görüldüğü üzere yinelenen örneklemlerde Y’nin değeri değişmektedir. Pek tabiidir
ki; bağımlı değişkene ait veriler farklı olduğu için her iki örnekten farklı örnek regresyon
doğruları elde edilecektir. Buna göre Örnek 1 ve Örnek 2’ye ait regresyon doğruları Şekil 2.2’de
verilmiştir.
Şekil-2.2: Örnek regresyon doğruları
Regresyon analizdeki birinci amaç, örneklem verilerinin kullanılarak tahmin edilen
örnek regresyon fonksiyonundan (diğer bir ifade ile örnekten tahmin edilen bilgilerle) ana kütle
regresyon fonksiyonunu tahmin etmektir. Örnek regresyon fonksiyonu aşağıdaki gibi ifade
edilmektedir.
1 2ˆ ˆˆ
i iY X
48
Burada ˆiY , ana kütle regresyon modelindeki bağımlı değişken Y’nin koşullu ortalamasının-
( | )E Y X - tahminidir. Diğer unsurlar 1 , 2 sırasıyla anakütle parametreleri 1 ve 2 nin
tahmini verir. Buradan örnek kütle regresyon modeli aşağıdaki gibi yazılır.
1 2ˆ ˆ ˆ
i i iY X u
Denklemde yer alan ˆiu , kalıntı olarak adlandırılmakta olup ana kütledeki hata terimini iu ’nin
tahminidir. Böylece ana kütle regresyon modeli
1 2i i iY X u
İken, örnek kütle regresyon modeli
1 2ˆ ˆ ˆ
i i iY X u
ile ifade edilir . Burada önemli bir husus, ana kütle yerine örnekten hareket edildiği durumda
ana kütle regresyon denklemi ve dolayısıyla ana kütle hata terimi iu bilinmediği için
iu ’nin
varyansı hesaplanamayacağıdır. Örnek regresyon fonksiyonu mümkün olduğunca ana kütle
regresyon fonksiyonuna yakın tahmin edilmelidir.
Şekil-2.3: Anakütle ve örnek regresyon doğruları
Şekil-2.3 ‘de de görüldüğü üzere ana kütle regresyon doğrusu her alt ana kütle için
hesaplanan bağımlı değişkenin beklenen değerlerinden geçerken, örnek regresyon doğrusu
bağımlı değişkenin tahmini değerlerinden geçmektedir.
Hata Teriminin Kaynakları
1. Spesifikasyon (belirlenme) hataları
49
- Dışlanmış değişken: Modelde yer alması gereken bağımsız değişken veya
değişkenlerin bilerek ya da bilmeyerek model dışında bırakılması
- Gereksiz değişken: Bağımlı değişken üzerinde etkili olmadığı halde bazı değişkenler
modelde etkileyici (bağımsız) değişken olarak yer verilmesi
- Matematiksel biçimleme hatası: Değişkenler arasındaki fonksiyonel ilişki doğrusal
olmadığı halde doğrusal olarak ele alınması
-Eşanlı modelin tek denklem ile ifade edilmesi: Değişkenler arasında karşılıklı
etkileşim olduğu halde, ilişki tek yönlü gibi ele alınarak tek denklemli modelin çözümü
2. Ölçme ve birleştirme hataları
3. Aynı iktisadi olay için bireylerin davranışındaki farklılıklar.
EK 2.1: Ana kütle regresyon fonksiyonunun belirlenmesi
Tüketim harcamaları ve gelir ile ilgili hipotetik verilerden ana kütle regresyon modelini
oluşturalım.
Öncelikle hatırlanacağı üzere, ana kütle regresyon modeli aşağıdaki gibi
1 2( )E Y X X
veya diğer bir şekliyle
1 2iY YX X
ile gösterilmektedir. Burada X , X bağımsız değişkeninin ortalaması ki; bu X rassal olmadığı
için koşulsuz ortalamadır. iYX , Y’nin X ‘bağlı koşullu ortalamasını göstermekte olup, ( )E Y X
’nın diğer bir gösterim şeklidir. Y , Y’ nin koşulsuz ortalamasıdır ve Y’nin koşullu ortalaması
ile koşulsuz ortalaması eşittir (iY YX ).
Amacımız 1 ve 2 ’in sayısal değerlerini bulmaktır. Hatırlanacağı üzere her alt ana
kütlenin koşullu ortalaması (beklenen değeri) hesaplanmıştı.
Öncelikle hesaplanmış olan alt ana kütle koşullu ortalamaları kullanılarak ana kütle
regresyonun doğrusunun eğimini veren 1 parametresinin değeri hesaplanacaktır. 2 marjinal
etkiyi ifade ettiğine ve X’ deki 1 birimlik değişme karşılığında Y’nin beklenen değerindeki
değişmeyi verdiğine göre aşağıdaki gibi hesaplanır.
50
2
2 1
100 80 77 65 12den
100 80 20
E Y X E Y X
X X
2 0.6
veya başka iki noktadan;
2
2 1
220 200 149 137 12den
220 200 20
E Y X E Y X
X X
2 0.6
veya,
2
3 1
120 80 89 65 24den
120 80 40
E Y X E Y X
X X
2 0.6 ’ye eşittir. 1 regresyon doğrusunun eğimine eşit olduğu için hangi iki
noktayı alırsanız sonuç değişmeyecektir, Doğrunun eğimi her noktada sabittir.
Bağımsız değişkenin (X) koşulsuz ortalaması x :
5 6 7 10420
80 100 ........................... 26060 60 60 60
x
173.67x
olarak hesaplanır.
Bağımlı değişkenin(Y) koşulsuz ortalaması Y :
7272
121.260
ij
Y YX
Y
N
sonucuna ulaşılır. Bu değer aynı zamanda Y’nin koşullu ortalamasına ( YX ) eşittir.
veya,
5 6 5 6 7 727265 77 89 161 173 121.2
60 60 60 60 60 60Y
51
hesaplanır. Y ve X’in koşulsuz ortalamaları ve 1 hesaplandığına göre 0 aşağıdaki gibi
hesaplanır.
1 2Y x
1121.1 0.6 173.67
1 17
Böylece anakütle regresyon denklemi
( | ) 17 0.6i iE Y X X
Olarak bulunmuş olur. Anakütle regresyon denklemine göre gelir 100 lira artarsa tüketim 60
lira artacaktır. Tanım gereği 0.6 bu ana kütle için marjinal tüketim meyline eşittir. Otonom
parametre ise zorunlu tüketim harcamalarının 1700 lira olduğunu göstermektedir.
Yukarıdaki denklem sonraki derslerimizde tahmin edeceğimiz ana kütle regresyon
denklemidir. Bu çözüm sadece sizin “Neyi tahmin ediyoruz” sorunuza cevap olması için
verilmiştir.
52
Uygulamalar
53
Uygulama Soruları
Bir yatırımcının sahip olduğu portföydeki 18 hisse senedinin risk ve getiri rakamları
aşağıdaki tabloda verilmiştir.
Ri 6 10 14 18
Gij
1 4 8 -6
3 5 -6 18
2 4 12 -9
2 3 9 17
1 12
ni 4 4 5 5
Toplam 8 16 24 32
Ri= Risk ( %) , Gi= Getiri (%) n=18
1. Hisse senetleri riski ile getirilerinin yer aldığı tabloyu genel özellikleri ile
yorumlayalım.
Yatırımcının portföyü bir ana kütleyi temsil etmektedir. Getiri, riskin fonksiyonu olduğu
varsayımı altında; risk bağımsız değişken, getiri bağımlı değişkendir. Kısaca risk
değişkeninden getiri değişkenine doğru bir nedensellik ilişkisi vardır. Tabloda 18 hisse senedi
için, hisse senedinin riskine karşılık gelen hisse senedi getirilerin dağılımı yer almaktadır. Hisse
senetleri sahip oldukları risk itibariyle 4 alt ana kütleye ayrılmıştır. Her alt ana kütle veya her
sütun, sabit bir riske karşılık gelen getiri dağılımını diğer bir ifade ile risk veri iken getirinin
koşullu dağılımını vermektedir. Örneğin riski % 6 olan hisse senetlerinin getirisi %1 ile %3
arasında değişiyor iken, riski % 14 olan hisse senetlerinin getirisi -%6 ile %12 arasında
değişmektedir.
2. Risk veri iken, hisse senedi getirilerinin koşullu olasılıkları hesaplayalım.
Yukarıdaki tabloya göre örneğin %10 riske sahip hisse senetleri için %4, %5 , %4
ve %3 olmak üzere 4 farklı getiri oranının olduğu gözlemlenmektedir. Buna göre; riski %10
olan hisse senetlerinden herhangi birini elde etme olasılığı 1/4 ‘e eşittir.
4 10 5 10
4 10 3 10 1/ 4
P G R P G R
P G R P G R
Benzer şekilde %18 riske sahip hisse senetleri için -% 6, %18, -%9, %17 ve %12 olmak
üzere 5 farklı getirinin gerçekleştiği görülmektedir.. Buna göre; riski %18 olan bu hisse
senetlerinden herhangi birini elde etme olasılığı 1/5‘ye eşittir.
6 18 18 18 9 18
17 18 12 18 1/ 5
P G R P G R P G R
P G R P G R
54
Böylece risk veri iken hisse senedi getirilerinin koşullu olasılıkları aşağıdaki tablodaki
gibidir.
Ri 6 10 14 18
i iP G G R R
1/4 1/4 1/5 1/5
1/4 1/4 1/5 1/5
1/4 1/4 1/5 1/5
1/4 1/4 1/5 1/5
1/5 1/5
ni 4 4 5 5
3. Hisse senedi getirilerinin koşullu ortalama (beklenen değeri) değerlerini
hesaplayalım.
Örneğin riski %14 olan 5 hisse senedinin getirileri %8, -%6, %12, %9, %1’e eşittir.
Hisse senedi getirilerinin koşullu olasılığı Uygulama 2 de hesaplandığı üzere 1/5’e eşittir. Buna
göre riski %14 olan 5 hisse senedinin getirilerinin koşullu ortalaması (beklenen değeri)
aşağıdaki gibi hesaplanabilir.
1 1 1 1 114 8 ( 6) 12 9 1
5 5 5 5 5
1(8 ( 6) 12 9 1) 4.8
5
E G R
Aynı şekilde riski % 6 olan 4 hisse senedinin getirileri %1, %3, %2 ve %2’ye eşittir.
hisse senedinin getirilerinin koşullu olasılığı ise 1/4’e eşittir. Buna göre riski % 6 olan 4 hisse
senedinin getirilerinin koşullu ortalaması (beklenen değeri) aşağıdaki gibidir.
1 1 1 16 1 3 2 2
4 4 4 4
1(1 3 2 2) 2
4
E G R
Buna göre diğer alt ana kütleler içinde aynı hesaplama yapılırsa aşağıdaki tablonun
son satırı elde edilecektir.
Ri 6 10 14 18
iE G R R 2 4 4.8 6.4
Tabloda görüldüğü üzere hisse senetlerinin riski arttıkça, hisse senedi getirilerinin
koşullu ortalaması da artmaktadır. Daha öncede ifade edildiği üzere bağımlı değişkenin
koşullu ortalaması, bağımsız değişken X’in doğrusal bir fonksiyonudur.
4. Hisse senedi getirilerinin koşullu ortalama değerleri bilindiğine göre her alt
ana kütle için hata terimlerini hesaplayabiliriz.
55
Örneğin birinci alt ana kütlede hisse senetleri getirilerinin gözlemlenen değerleri
sırasıyla %1, %3, %2 ve %2’e eşittir. Hisse senetleri getirilerinin koşullu ortalamasının da %2
olduğu bilindiğine göre
( | 6)i iG E G R u ’dan
( | )i i iu G E G R R olacak ve ( | 6) 2E G R olduğu bilindiğine göre hata
terimleri sırasıyla
1 1 2 1u
2 3 2 1u
3 2 2 0u
4 2 2 0u
olarak hesaplanır. Diğer alt ana kütlelerin de hata terimleri aynı şekilde hesaplanmış ve
aşağıdaki tabloda verilmiştir
Ri 6 10 14 18
uij
-1 0 3.2 -12.4
1 1 -10.8 11.6
0 0 7.2 -15.4
0 -1 4.2 10.6
-3.8 5.6
Yukarıdaki tablodan da görüldüğü üzere riskin sabit değerine karşın hata terimi
birbirinden farklı değerler almaktadır. Böylece hata terimi rassal bir değişkendir ve olasılık
dağılımı vardır.
5. Uygulama 4’de hesaplanan hata terimlerinin koşullu olasılıklarını hesaplayalım.
Örneğin birinci alt ana kütle için koşullu olasılıkları aşağıdaki gibi hesaplayabiliriz;
1 6 1 10
0 10 0 10 1/ 4
P u R P u R
P u R P u R
Ri 6 10 14 18
i iP u u R R
1/4 1/4 1/5 1/5
1/4 1/4 1/5 1/5
1/4 1/4 1/5 1/5
1/4 1/4 1/5 1/5
1/5 1/5
ni 4 4 5 5
56
6. Uygulama 5 de hata terimlerinin koşullu olasılıkları hesaplandığına göre, Uygulama
4’de hesaplanan hata terimlerinin koşullu ortalamalarını (beklenen değerlerini)
hesaplayabiliriz.
Örneğin Riskin %18 olduğu alt ana kütle için hesaplanan hata terimlerinin koşullu ortalaması
1 1 1 1 114 ( 12.4) 11.6 ( 15.4) 10.6 5.6
5 5 5 5 5
1( 12.4) 11.6 15.4 10.6 5.6 0
5
E u R
Ri 6 10 14 18
iE u R R 0 0 0 0
7. Risk veri iken hisse senedi getirilerinin koşullu varyansını hesaplayalım.
Örneğin risk %10 iken getirinin koşullu varyansı aşağıdaki gibi hesaplanır. 10 4E G R
2 2
2 2 2 2
10 4
(4 4) (5 4) (4 4) (3 4)0.5
4
i iE G E G R E G
Ri 6 10 14 18
2
i iE G E G R R 0.5 0.5 42.16
133.84
8. Risk veri iken hata terimini koşullu varyansını hesaplayalım.
Örneğin risk %10 iken hata teriminin koşullu varyansı aşağıdaki gibi hesaplanır.
10 0E u R
2 2
2 2 2 2
10 0
(0 0) (1 0) (0 0) ( 1 0)0.5
4
i iE u E u R E u
Ri 6 10 14 18
2
i iE u E u R R 0.5 0.5 42.16
133.84
Uygulama 7 ve Uygulama 8 ‘deki sonuçlardan görüleceği üzere her alt ana kütle için bağımlı
değişken getirinin koşullu varyansı ile hata teriminin varyansı eşittir.
57
9. “Regresyon analizi ……… ilişkisine dayandığı için, değişken seçiminde ……..
vardır” ifadesindeki boşluklara aşağıdakilerden hangisi gelecektir?
a) Nedensellik- asimetri
b) Doğrusallık-asimetri
c) Rassallık-simetri
d) Nedensellik- simetri
e) Rassallık-asimetri
10. Regresyon analizinin, korelasyon analizine benzerliği aşağıdakilerden hangisidir?
a) Her iki analizde de bağımlı ve bağımsız değişkenin yer alıyor olması
b) Her iki analizin de nedensellik ilişkisine dayanması
c) Her iki analizin de değişkenler arasında birlik ve beraberliği aramaları
d) Her iki analizin de kesin ilişkileri göstermesi
e) Her iki analizde de parametrelerin tahmin ediliyor olması
Cevaplar
9) a
10) c
58
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde basit doğrusal model çerçevesinde ana kütle regresyon modelini ve örnek
regresyon modelini tanıttık. Doğrusal regresyon modelinde bağımlı değişken , rassal değişken
ve bağımsız değişken ile ilgili temel varsayımları verdik. Bağımlı değişkenin beklenen değeri
ve varyansının nasıl hesaplandığını gördük. Bağımlı değişkenin gözlemlenen değerleri (teorik
değerleri) ile bağımlı değişkenin beklenen değerlerini kullanarak rassal hataların değerlerini
hesapladık. Hata teriminin (rassal hatalar) beklenen değeri ve varyansının nasıl
hesaplanacağını öğrendik. Hata terimlerinin beklenen değerinin sıfır olduğunu, varyansının ise
bağımlı değişken Y’nin varyansına eşit olduğunu tespit ettik. Böylece bağımlı değişken ile
rassal hatanın aynı dağılıma sahip oldukları sadece ortalamalarının farklı olduğu sonucuna
ulaştık. Regresyon modelinde yer alan parametrelerin yorumlarını öğrendik. Hata teriminin
kaynaklarının neler olduğunu öğrendik.
59
Bölüm Soruları
1. “ Anakütle regresyon doğrusu ….. üzerinden, örnek kütle regresyon doğrusu …..
üzerinden geçer ” ifadesindeki boşluklara aşağıdakilerden hangisi gelecektir?
a) Bağımsız değişkenin değerleri ; bağımsız değişkenin değerleri
b) Bağımlı değişkenin koşullu ortalaması değerleri ; bağımlı değişkenin tahmini değerleri
c) Bağımlı değişkenin tahmini değerleri ; bağımlı değişkenin koşullu ortalama değerleri
d) Bağımlı değişkenin gözlemlenen değerleri ; bağımlı değişkenin koşullu ortalama değerleri
e) Bağımlı değişkenin koşullu ortalama değerleri ; bağımsız değişkenin gözlemlenen
değerleri
2. Bağımlı değişkenin gözlemlenen değeri, bağımlı değişkenin koşullu olasılığı, bağımlı
değişkenin beklenen değeri, bağımlı değişkenin tahminini ifade eden terimler sırasıyla
aşağıdakilerden hangiside doğru verilmiştir?
a) iY ; ( )iE Y X X ; ( )i iP Y Y X X ; ˆiY
b) ˆiY ; iY ; ( )iE Y X X ; ( )i iP Y Y X X
c) iY ; ( )i iP Y Y X X ; ( )iE Y X X ; ˆiY
d) ˆiY ; ( )iE Y X X ; ( )i iP Y Y X X ; iY
e) iY ; ( )i iP Y X X X ; ( )i iE Y X X X ; ˆiY
3. Aşağıdaki gösterimlerden hangisi yanlıştır?
a) 1 2( )i iE Y X X X
b) 0 1 1 2 2ˆ ˆ ˆ ˆi i iY X X
c) 0 1 1 2 2ˆ ˆ ˆ( )i i i iE Y X X X X u
d) 0 1ˆ ˆ ˆ
i i iY X u
e) ( )i i iY E Y X X u
4. Aşağıdaki ifadelerden hangisi yanlıştır?
a) Bağımlı değişken olasılık dağılımına sahiptir.
60
b) Bağımsız değişken tekrarlanan örneklerde farklı değer alabilir.
c) Hata terimi, bağımlı değişkenin gözlenen değeri ile bağımlı değişkenin beklenen değeri
arasındaki farka eşittir.
d) Kalıntı, bağımlı değişkenin gözlemlenen değeri ile bağımlı değişkenin tahmini değeri
arasındaki farka eşittir.
e) Regresyon modelinde eğim katsayısı marjinal değişmeyi gösterir.
5. “Hata terimi ……………….. iken, kalıntı………………….. arasındaki farka eşittir”
ifadesindeki boşluklara aşağıdakilerden hangisi gelecektir?
a) ( )i iY E Y X X ; ˆi îY Y
b) ˆi îY Y ; ( )i iY E Y X X
c) ( )i iE Y X X Y ; ˆî iY Y
d) ˆiY Y ; ( )iE Y X X Y
e) ( )i iE Y X X X ; ˆi iY X
6. Aşağıdakilerden hangisi örnek regresyon doğrusudur?
a) 0 1ˆ ˆ( )i iE Y X X X
b) 0 1ˆi iY X
c) 0 1( )i iE Y X X X
d) ˆ ˆ( )i i iY E Y X X u
e) 0 1ˆ ˆ ˆi iY X
7. Aşağıdaki ifadelerden hangisi yanlıştır?
a) Hata terimi ile bağımlı değişken aynı dağılıma sahiptir, ancak koşullu ortalamaları
farklıdır.
b) Hata teriminin koşullu ortalaması sıfır iken, bağımlı değişkenin koşullu ortalaması
0 1 iX ’ya eşittir.
c) Hata terimi ile bağımlı değişken rassal değişkenlerdir.
61
d) Bağımlı değişkenin değeri biliniyor iken, hata teriminin değerleri modelin çözümü
sonucunda hesaplanır.
e) Bağımlı değişken rassal iken, hata teriminin değeri gözlemler itibariyle sabittir.
8. Bağımlı değişken ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?
a) Bağımlı değişken rassal bir değişkendir..
b) Bağımlı değişkenin olasılık dağılımı vardır, dolayısıyla koşullu ortalama ve koşulu
varyansı hesaplanabilir.
c) Bağımlı değişkenin olasılık dağılımı olduğu için koşullu olasılıkları hesaplanabilir.
d) Bağımlı değişkenin değeri her gözlem için sabittir..
e) Bağımlı değişkenin bileşenleri, sistematik ve stokastik unsurlardır.
9. 0 1( )i iE Y X X X modelinde yer alan 1 parametresi ile ilgili olarak
aşağıdakilerden hangisi yanlıştır.
a) 1 parametresi, X ’deki 1 birimlik değişme karşısında bağımlı değişkenin beklenen
değerindeki ( ( )iE Y X X ) değişmeyi gösterir.
b) 1 parametresi, ana kütle regresyon doğrusunun eğimine eşittir.
c) 1 parametresi, marjinal etkiyi ifade eder.
d) 1 parametresi, ana küte regreyon doğrusunun Y eksenini kestiği noktadaki değerine
eşittir.
e) 1 parametresi X değişkeni ile Y’nin beklenen değeri arasındaki ilişkiyi gösterir.
10. Hata terimi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?
a) Hata teriminin beklenen değeri sıfırdır ( ) 0iE u X X
b) Hata terimi rassal bir değişkendir.
c) Hata terimi olasılık dağılımı olan bir değişkendir.
d) Hata terimi Y nin gözlemlenen değerlerinin koşullu ortalamasıdır. .
e) Hata teriminin koşullu varyansı ile bağımlı değişkenin koşullu varyansı eşittir,
2 2
i i i i i iE Y E Y X X E u E u X X
62
Cevaplar
1) b
2) e
3) c
4) b
5) a
6) e
7) e
8) d
9) d
10) d
63
3. BASİT DOĞRUSAL REGRESYON MODELİ
64
Bu Bölümde Neler Öğreneceğiz?
3.1. Regresyon Parametrelerinin Tahmini
3.2. En Küçük Kareler Yaklaşımı
3.2.1. Basit Regresyon Modelinin Tahmini için En Küçük Kareler Yöntemi
3.2.2. En Küçük Kareler Yönteminin Sapmalar Kuralı ile Uygulaması
3.3. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları
3.4. En Küçük Kareler Yönteminin Özellikleri
3.5. Öngörü
65
Bölüm Hakkında İlgi Oluşturan Sorular
1) Örnek verilerinden regresyon doğrusunun parametreleri nasıl tahmin edilir?
2) Aynı ana kütleden çekilen iki veya daha fazla örneğin örnek regresyon denklemleri
aynı mıdır?
3) Elde edilen tahminler nasıl yorumlanır?
4) Regresyon denklemi kullanılarak öngörüde bulunmak mümkün müdür?
66
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
En küçük kareler yöntemi Örnek regresyon
modelindeki parametrelerin
tahmin edilmesi
En Küçük Kareler
yönteminin uygulaması
özümsenmeli, ders
notlarında uygulamalı
sorular çözümlenmelidir
Farklı veriler uygulamalar
yapılarak bilgiler
pekiştirilmelidir
En küçük kareler yönteminin
normal denklemlere ve
sapmalar kuralına göre
uygulaması
Her iki yöntemin de aynı
sonucu verdiğinin görülmesi
Ders notlarındaki sorular iki
yönteme göre çözülmeli,
sonuçlar karşılaştırılmalıdır.
Farklı veriler uygulamalar
yapılarak bilgiler
pekiştirilmelidir
Öngörü Tahmin edilen regresyon
modelinin öngörü veya
geleceğin tahmin amacıyla
kullanılabileceğinin
anleşılması
Ders notları
En küçük kareler yönteminin
özellikleri
Analizlerin daha iyi
anlaşılabilmesi
Ders notları
67
Anahtar Kavramlar
En küçük kareler tahmincisi
En küçük kareler tahmini
BLUE tahmin
Kalıntı
Öngörü
68
Giriş
Regresyon analizinde amaç, örnek verilerinden ana kütle regresyon modeli için en
uygun tahmini elde etmektir. Bu amaç için başlangıç düzeyi için kullanılabilecek yöntemler
arasında En Küçük Kareler Yöntemi en fazla tercih edilenidir.
Bu bölümde En küçük kareler yöntemi tanıtılacak ve iki farklı uygulaması üzerinde
durulacaktır. Açıklayıcı örneklerin çözümü ile konunun pekiştirilmesi amaçlanmıştır. Tahmin
edilen parametrelerin iktisadi açıdan ne anlama geldiği ve doğru yorumlanması önem arz
etmektedir.
Regresyon analizinin hedeflerinden biri tahmin edilen regresyon modelinden bağımlı
değişken için öngörüde bulunmaktır. Bu bölümde öngörü üzerinde de kısaca durulacaktır.
Okuma metininde geçen ispatlar konuya ayrıca ilgi duyanlar için verilmiştir.
69
3.1. Regresyon Parametrelerinin Tahmini
İkinci bölümde ele alınan ana kütle regresyon modelinin parametrelerini tahmin etmek
için, örnek verisini kullanmak temeldir. Çünkü ana kütle ile ilgili verilerin sağlanması her
zaman mümkün olmayabilir. Ana kütle regresyon modelinde yer alan unsurlar ( Y ve X )
doğrudan gözlenemediği için, bağımlı değişken ile bağımsız değişken arasında ilişki kuran
0 1( )i iE Y X X X regresyon doğrusunun koordinat sisteminde yerinin belirlenmesi
sorundur. Bağımlı değişken ile bağımsız değişken arasındaki ortalama ilişkiyi gösteren ana
kütle regresyon doğrusunun tüm veri noktalarının ortasında bir yerde olacağı beklenmektedir.
Amacımız örnek verilerinden hareket ederek 0 1( )i iE Y X X X regresyon
doğrusunun tahmin edilmesidir. Bu amaç için, ana kütle parametreleri 0 ve 1 ’in tahmin
edilmesi gerekir. İkinci bölümde de ifade edildiği üzere 0 ve 1 ’in örnek verilerinden
tahminleri 0 ve 1 ile gösterilmektedir.
Örnek verileri kullanılarak 0 ve 1 ’in tahmin edilebilmesi için kullanılan başlıca
parametre tahmin yöntemleri:
Momentler yöntemi
En Çok Benzerlik (EÇB) yöntemi (Maksimum Olabilirlik yöntemi)
En Küçük Kareler (EKK) yöntemi’dir.
EKK yöntemi diğer tahmin yöntemleri ile karşılaştırıldığında, uygulaması daha basit
olduğu ve ekonometrik modelin lehine doyurucu sonuçlar verdiği için tercih edilmektedir.
Bundan dolayı En Çok Benzerlik Yöntemi dışındaki diğer tahmin yöntemleri bazı yönleri ile
EKK yönteminin düzeltilmiş şeklini içermektedir. Bu bölümde uygulamada en yaygın
kullanılan En Küçük Kareler (EKK) tahmin yöntemi ile basit doğrusal regresyon modelinin
tahmini detayları ile verilecektir.
3.2. En Küçük Kareler Yaklaşımı
3.2.1. Basit Regresyon Modelinin Tahmini İçin En Küçük Kareler
Yöntemi
Regresyon analizinde, örnek verileri temel alınarak ana kütle regresyon fonksiyonunu (
0 1( )i iE Y X X X ) mümkün olduğu kadar doğru tahmin etmek temel hedeftir.
En Küçük Kareler ilkesine göre veri değerlerine uygun doğru için, n tane iX ve iY
veriyken örnek regresyon fonksiyonundan elde edilen ˆiY ’ler, gözlemlenen (teorik) iY ’lere
70
olabildiğince yakın olmalıdır. Bunun için kıstas, gözlemlenen iY ’ler ile tahmin edilen ˆiY
arasındaki fark olarak tanımlanan kalıntı ( ˆi i iu Y Y ) karelerinin toplamını minimize eden 0
ve 1 değerlerini bulunmasıdır. Pozitif uzaklıkların negatif uzaklıklarla ortadan kaldırılmasını
önlemek için, iY ile ˆiY arasındaki dikey uzaklıkların ( ˆiu ) karesi alınmaktadır.
Bu durumda her bir veri noktasından ( iY ) örnek regresyon doğrusuna ( 0 1ˆ ˆˆ
i iY X )
dikey uzaklıklar ( ˆiu ) aşağıda verilmiştir.
0 1ˆ ˆˆ
i i i i iu Y Y Y X
Buradan kalıntıların karelerinin toplamı aşağıdaki gibi gösterilir.
2 2 2
0 1ˆ ˆˆˆ ( ) ( ) mini i i i iu Y Y Y X
Kalıntı kareler toplamının minimum (2ˆ miniu ) olması durumda, tahmin edilen 0
ve 1 parametreleri doğrusal, sapmasız (eğilimsiz) ve en iyi (tesirli, en küçük varyanslı) -
BLUE- tahminlerdir. Kalıntı kareler toplamını minimum yapma koşulu ise, kalıntı kareler
toplamı fonksiyonunda 0 ve 1 parametrelerine göre birinci dereceden kısmi türevlerin sıfıra
eşitlenmesi ile mümkündür. Kısaca,
2
0
ˆ0
ˆiu
ve 2
1
ˆ0
ˆiu
olarak ifade edebiliriz. Kalıntı kareler toplamı fonksiyonunda 0 ve 1 parametrelerine göre
kısmi türev alınır ve gerekli sadeleştirmeler yapılırsa aşağıdaki denklemler elde edilir.
0 1
2
0 1
ˆ ˆ
ˆ ˆ
i i
i i i i
Y n X
Y X X X
Yukarıdaki iki denklem birlikte bir denklem sistemini oluşturur ve normal denklemler
olarak adlandırılır. Burada n örneklem büyüklüğüdür.
71
İSPAT (Okuyucunun isteğine bağlı)
Normal Denklemlerin Elde Edilmesi
2 2
0 1
0 1
0 0
ˆ ˆˆ ( ) ˆ ˆ0 ( 2) ( ) 0ˆ ˆ
i i i
i i
u Y XY X
2 2
0 1
0 1
1 1
ˆ ˆˆ ( ) ˆ ˆ0 ( 2) ( )( ) 0ˆ ˆ
i i i
i i i
u Y XY X X
Eşitliklerin her iki yanı (-2)’ ye bölünür.
0 1
0 1
ˆ ˆ( 2) ( ) 0 ˆ ˆ( ) 0( 2) ( 2)
i i
i i
Y XY X
0 1
0 1
ˆ ˆ( 2) ( )( ) 0 ˆ ˆ( )( ) 0( 2) ( 2)
i i i
i i i
Y X XY X X
Toplama işlemcisi ( ), parantez içine dağıtılır ve sadeleştirmeler yapılırsa aşağıdaki
denklemler elde edilir. ( Not: ’nın sabit bir terim olan 0 ile çarpımından “n 0 ” elde edilir.)
0 1ˆ ˆ 0i iY n X
2
0 1ˆ ˆ 0i i i iY X X X
Bağımlı değişkeni içeren unsurlar eşitliğin sol tarafında bırakılarak,
0 1ˆ ˆ
i iY n X
2
0 1ˆ ˆ
i i i iY X X X
sonucuna ulaşılır.
Normal denklemler 0 ve 1 için Cramer yöntemi ile çözülürse;
2 2
0 2 2
2
ˆ( )
i i i i
i ii
i i
Y X
YX X Y X Y X X
n X Xn X
X X
72
1 2 2
2
ˆ( )
i
i i i i i i i
i ii
i i
n Y
X Y X n Y X X Y
n X Xn X
X X
eşitlikleri elde edilir. Normal denklemlerin çözümünden sağlanan bu eşitlikler, En Küçük
Kareler tahmincileridir. iX ve iY ’in örnek değerleri Cramer yöntemi ile elde edilen
denklemlere uygulanırsa, 0 ve 1 parametrelerinin En Küçük Kareler tahminleri elde edilir.
Ana kütleden çekilen örnek verileri örnekten örneğe değişeceği için, EKK tahminleri
de değişecektir. Bu durumda 0 ve 1 rassal değişkenlerdir.
EKK tahmincileri, genel formüller ve rassal değişkenlerdir.
EKK tahminleri, gözlemlenen verilere genel genel formüllerin uygulanması ile elde
edilen sayısal değerlerdir.
3.2.2. En Küçük Kareler Yönteminin Sapmalar Kuralı ile Uygulaması
EKK’in normal denklemlerinde iX ve iY ’ye ait örneklem değerlerinin sıfırdan
uzaklıkları kullanılmaktadır. Bu durumda orjin O(0;0) noktasıdır. Aritmetik ortalamanın
sağladığı kolaylıklardan yararlanılarak, EKK tahmincilerini daha basit biçimde formüle etmek
mümkündür. En küçük kareler tahmincilerinin iX ve iY ’in örnek değerlerinin örnek ortalama
değerlerinden ( X , Y ) farkları ile gösterimi EKK yönteminin diğer bir uygulama biçimi
sapmalar yöntemidir. Örnek değerlerinin örnek ortalama değerlerinden uzaklıklarının dikkate
alındığı söz konusu durumda orjin O ( X ; Y ) noktasıdır. En küçük karelerin sapmalar
yöntemine göre tahmincileri aşağıdaki gibidir.
1 22ˆ i ii i
i i
X X Y Yx y
x X X
0 1ˆ ˆY X
Burada iX X n ve iY Y n , Y ve X gözlemlerinin örnek ortalamalarıdır.
i ix X X , i iy Y Y ise, Y ve X gözlem değerlerinin örnek ortalamalarından farklarıdır.
Kısaca ix ve iy ortalamadan sapmadır. Sapmalar kuralına göre EKK yönteminin
uygulamasında öncelikle 1 , ikinci aşamada 0 ’ın hesaplanması gerekir.
73
İSPAT (Okuyucunun isteğine bağlı)
EKK Tahmincilerinin EKK Sapmalar Yöntemine Göre Elde Edilmesi
1 için EKK tahmincisinin pay ve paydasını gözlem sayısı n’e bölünür.
1 22 2 2
ˆ( )
i i i i i i i i
i i i i
n Y X X Y n Y X X n Y n
n X X n X X n
İstatistik dersinden;
iX n X ve iY n Y olduğu bilinmektedir. Buna göre yukarıdaki denklemde
iX n yerine X ve iY n yerine Y yazılır ise aşağıdaki denklem elde edilecektir.
1 2 2ˆ i i
i
X Y nXY
X nX
Burada i i i iX Y nXY x y ve 2 2 2
i iX nX x eşitlikleri söz konusudur.
Sonuç olarak sapmalar yöntemine göre EKK tahmincisi aşağıdaki gibidir.
1 2ˆ i i
i
x y
x
2 2 2
i ix X nX eşitliğini aşağıdaki gibi gösterebiliriz. i ix X X eşitliği
bilindiğine göre;
22
i i i ix X X X X X X
2 2
i i iX XX XX X
Toplama işlemcisi parantez içine dağıtılır. Burada X bir sabit olduğu için nX ‘dır.
2 2 2
i i i ix X X X X X nX
2 22i iX X X nX
Yine iX n X eşitliğinden iX nX yazılabilir ve
74
2 2 22i ix X X nX nX
2 2 22iX nX nX
Buradan;
2 2 2
i ix X nX
eşitliğine ulaşılır. i i i ix y X Y nXY olduğunun ispatı okuyucuya bırakılmıştır.
En küçük kareler yönteminin sapmalar kuralına göre uygulamasında 1 ’den
sonra 0 tahmincisinin elde edilmesi için normal denklemlerden birincisi kullanılır ve
denklemin her iki yanı gözlem sayısı n’e bölünür.
0 1ˆ ˆ
iiY n X
0 1ˆ ˆ
i iY n Xn n
Buradan
0 1ˆ ˆY X
elde edilir. Eşitlik 0 için yeniden düzenlendiğinde
0 1ˆ ˆY X
sonucuna ulaşılır.
EKK yönteminin her iki uygulamasında da 0 ve 1 için aynı sonuçlar elde edilecektir.
1 2ˆ i i
i
x y
x
eşitliğini aşağıdaki verildiği gibi göstermek mümkündür:
1 2 2 2ˆ i i i i i i
i i i
x y X y x Y
x x x
75
İSPAT (Okuyucunun isteğine bağlı)
i i i ix y xY eşitliği aşağıdaki gibi gösterilir.
i iy Y Y eşitliği bilindiğine göre;
i i i ix y x Y Y yazılır ve ix parantez içine dağıtılır.
i i i i ix y xY Y x
Yine istatistik dersinin konusu aritmetik ortalamanın özelliklerinden
0i ix X X olduğu bilinmektedir. Buna göre;
0 0i i i i i ix y xY Y xY
olacak ve
i i i ix y xY
eşitliği elde edilecektir. i i i ix y y X olduğunun ispatı okuyucuya bırakılmıştır.
3.3. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları
Aşağıda bir spor giyim mağazasının 5 aylık satış gelirleri ile reklam harcamalarına
ilişkin veriler yer almaktadır. Bu verileri kullanarak örnek regresyon denklemini ( 0 1ˆ ˆˆ
t tY X
) tahmin ediniz.
Aylar Satış Gelirleri
(1000 L)
Reklam Harcamaları
(1000 L)
1 3 1
2 4 2
3 2 3
4 6 4
5 8 5 Tablo 3.1. : Satış gelirleri ve reklam harcamaları
Örnek regresyonunun tahmin edilebilmesi için öncelikle bağımlı ve bağımsız
değişkenlerin belirlenmesi gerekir. Satışlar, reklam harcamalarının bir fonksiyonu olduğu diğer
bir ifade ile nedensellik reklam harcamalarından satışlara doğru olduğu için satışlar bağımlı
değişken reklam harcamaları bağımsız değişkendir.
Y= Satışlar (1000 lira)
76
X= Reklam harcamaları (1000 lira)
Satışlar( ) Reklam Harcamaları( )Y X
Örnek regresyon fonksiyonu, EKK yöntemiyle yukarıda anlatıldığı üzere
X ve Y’nin gözlemlenen (teorik) değerlerinden
veya
X ve Y ’nin gözlemlenen değerlerinin ( ,i iX Y ) kendi ortalamalarından ( ,X Y )
farklarından ( ,i ix y )
olmak üzere iki şekilde tahmin edilebilir.
Öncelikle X ve Y ’nin gözlem değerleri kullanılarak örnek regresyonu tahmin
edilecektir. Bu amaçla
0 1
2
0 1
ˆ ˆ
ˆ ˆ
ii
i i i i
Y n X
Y X X X
normal denklemlerdeki değişkenlerle ilgili unsurların (i
Y , iX , i iY X ,2
iX )
hesaplanması gerekecektir. Gözlem sayısı (n ) 5’e eşittir.
Y X X2 XY
3 1 1 3
4 2 4 8
2 3 9 6
6 4 16 24
8 5 25 40
iY =23
iX =15
2
iX 55 ii
Y X 81
Tablo-3 .2: Satışlar ve reklam harcamalarının ara sonuçları
Tablonun son satırı ara sonuçlar kullanılarak tahmin değerleri aşağıdaki gibi hesaplanır.
2 2
0 2 2 2
2
23.55 81.15ˆ 1.0( ) 5.55 (15)
i i i i
i i i
i i
Y X
YX X Y X Y X X
n X n X X
X X
ve
77
1 2 2 2 2
2
5.81 15.23ˆ 1.2( ) 5.55 (15)
i
i i i i i i i
i i i
i i
n Y
X Y X n Y X X Y
n X n X X
X X
EKK tahminleri 0ˆ 1.0 , 1
ˆ 1.2 ‘dir. Buna göre; Satışlar ile reklam harcamaları
arasındaki ortalama ilişkinin tahmini örnek regresyon fonksiyonu aşağıdaki gibidir.
ˆ 1.0 1.2i iY X
İkinci olarak EKK yönteminin diğer bir uygulama biçimi olan sapmalar yöntemiyle de
aynı sonuca ulaşmak mümkündür. Bu amaç için aşağıdaki denklemler kullanılacaktır.
1 0 12ˆ ˆ ˆi i
i
x yY X
x
Öncelikle yine denklemlerde yer alan unsurların ( i ix y ,2
ix ,Y , X ) hesaplanması
gerekecektir. Bu amaç için Tablo 3.2 ’de elde edilen sonuçlar kullanılacaktır. Öncelikle X ve
Y ’nin hesaplanması gerekir.
15 23
3 4.65 5
X YX Y
n n
81 5.3.(4.6) 12i i i ix y X Y nXY
2 2 2 255 5.(3) 10i ix X nX
1 2
12ˆ 1.210
i i
i
x y
x
ve
0 2ˆ ˆ 4.6 (1.2).3 1.0Y X
olarak hesaplanır. Örnek regresyon fonksiyonu aşağıdaki gibidir.
ˆ 1.0 1.2i iY X
Görüldüğü üzere EKK yönteminin her iki uygulanmasının sonuçları aynıdır.
78
EKK tahminleri elde edildikten sonraki aşamada örnek regresyon doğrusunu koordinat
sistemi üzerinde gösterebiliriz. 2. Bölümde belirttiğimiz üzere örnek regresyon doğrusu bağımlı
değişkenin tahmini değerleri ( ˆiY ) üzerinden geçer. Buna göre öncelikle ˆ
iY ’lerin hesaplanması
gerekir. iX ’in değerleri (1,2,3,4,5) ˆ 1.0 1.2i iY X denkleminde yerine konur ve hesaplamalar
yapılırsa ˆiY ’ler elde edilecektir.
Örneğin 2 2X olduğu 2. gözlem için 2Y aşağıdaki gibi hesaplanır.
2 2ˆ 1.0 1.2 1.0 1.2 2 3.4Y X
İkinci gözlemde satışların gözlemlen değeri ( 2Y ) 4 iken, satışların tahmini ( 2Y ) 3.4’e
eşittir. Hesaplanan diğer sonuçlar aşağıdaki tabloda verilmiştir.
Y X X2 XY ˆiY
3 1 1 3 2.2
4 2 4 8 3.4
2 3 9 6 4.6
6 4 16 24 5.8
8 5 25 40 7.0
iY =23
iX =15
2
iX 55 ii
Y X 81 ˆi
Y =23
Bu aşamada her bir veri noktasından ( iY ) örnek regresyon doğrusuna ( 0 1ˆ ˆˆ
i iY X )
dikey uzaklıklar olan kalıntılar ( ˆiu ) ve kalıntı kareler toplamı (2ˆiu ) hesaplanacaktır.
0 1ˆ ˆˆˆ
i i i iu Y Y Y X
Örneğin 2. gözlem için kalıntı ( 2u ) aşağıdaki gibi hesaplanır.
2 2 2ˆˆ 4 3,4 0.6u Y Y
Hesaplanan diğer sonuçlar aşağıdaki tabloda verilmiştir.
Y X X2 XY ˆ
iY ˆiu
ˆi iY Y
2ˆiu
3 1 1 3 2.2 0.8 (0.8)2
4 2 4 8 3.4 0.6 (0.6)2
2 3 9 6 4.6 -2.6 (-2.6)2
6 4 16 24 5.8 0.2 (0.2)2
8 5 25 40 7.0 1 (1)2
iY 23 i
X
15
2
iX
55
iiY X
81
ˆi
Y
23
ˆi
u
0
2ˆiu
8.8
79
i=1,…,5’e kadar hesaplanan kalıntı kareler toplamının ( ˆi
u ) sıfıra eşit olduğuna dikkat
ediniz. Kalıntı kareler toplamı sıfıra eşittir, ˆ 0i
u . Tablodan görüldüğü üzere kalıntı kareler
toplamı (2ˆiu ) , 8.8’e eşittir,
2ˆ 8.8iu .
Şekil-3.1:Serpilme diyagramı, örnek regresyon doğrusu, kalıntılar
Yukarıdaki şekilde görüldüğü üzere EKK örnek regresyon doğrusu gözlemlenen
değerlerin arasından geçmektedir.
ˆ 1.0 1.2i iY X regresyon fonksiyonunu yorumlayalım. 0ˆ 1.0 sabit parametredir ve
geometrik açıdan regresyon doğrusunun dikey ekseni kestiği noktadır. Reklam harcamaları (X) sıfıra
eşit olduğu durumda satış gelirleri 1000 lira olacaktır. 1ˆ 1.2 eğim katsayısıdır. X değişkeni X
miktarı kadar değişirse, Y deki değişme 1.2Y X kadardır. Reklam harcamaları 1 birim (1000 lira)
artarsa satış gelirleri ortalama 1.2 birim (1200 lira) artacaktır.
80
3.4. En Küçük Kareler Yönteminin Özellikleri
En Küçük Kareler yönteminin özellikleri aşağıdaki gibi sıralanabilir.
1. En Küçük Kareler tahmin edicileri ( 0 ve 1 ) X ve Y değişkenlerin gözlenen değerleri ile
hesaplanabilir.
2. EKK tahmin edicileri nokta tahminlerdir. Örnek veriyken, örnekten tahmin edilen
parametre, ana kütledeki karşılığı için tek bir nokta tahmini verir.
3. Regresyon doğrusu ,A X Y noktasından geçer.
Şekil-3.2: Örneklem regresyon doğrusunun gösterimi
4. Bağımlı değişkenin tahmini değerlerinin ortalaması ( Y ), gözlemlenen değerlerinin
ortalamasına (Y ) eşittir,.
Y Y
81
İSPAT (Okuyucunun isteğine bağlı)
Örnek regresyon fonksiyonu 0 1ˆ ˆˆ
i iY X de
0 yerine eşiti olan 0 1ˆ ˆY X yazılır.
1 1ˆ ˆˆ ( )iY Y X X = 1
ˆ ( )iY X X
i. gözlem için verilen bu eşitlik, i=1,2……n’e kadar tüm gözlemler için eşitliğin her iki
tarafının toplamı alındığında;
1 1ˆ ˆˆ [ ( )]i iY Y X X nY x
sonucuna ulaşılır.
( ) 0i iX X x olduğundan
ˆiY nY
ulaşılır.
Eşitliğin her iki taraf gözlem sayısı n ile bölünürse;
ˆiY Y
sonucuna ulaşılır.
Bu özellik modelde sabit parametre olduğu sürece geçerlidir.
5. Kalıntıların toplamı diğer bir ifade ile ortalaması sıfıra eşittir. Bu özellik de yine
modelde sabit parametre varsa geçerlidir.
ˆˆ ˆ0 , 0i i iu Y Y u
Bu özellik EKK yönteminin 2
iu ’nın minimum olması varsayımına dayanmaktadır.
ˆiY nYn n
82
İSPAT (Okuyucunun isteğine bağlı)
Kalıntıların karelerinin toplamı fonksiyonunda 1 ’e göre birinci mertebeden kısmi türevi
alınarak olduğu gösterilebilir:
2
i0 1
1
u ˆ ˆ2( )( 1) 0ˆ i iY X
Eşitliğin her iki tarafı (-2)’ye bölünür.
0 1ˆ ˆ
iY X
ˆi iY Y
ˆ 0iu
Eşitliğin her iki yanı n’e bölündüğünde,
ˆ 0iu
n n ’den
ˆ 0u olacaktır.
Bu özellik ile örnek regresyon modeli, sadece gözlemlenen Xi ve Yi değerleriyle değil, X ve
Y’nin ortalama değerlerinden sapmaları biçiminde de yazılabilmektedir.
İSPAT (Okuyucunun isteğine bağlı)
Bağımlı değişkenin gözlemlenen değerini 0 1ˆ ˆ ˆ
i i iY X u ile ifade etmiştik. Tek bir gözlem
için yazılmış bu denklem i=1,2……n için tüm gözlemler için yazılıp, her iki tarafın toplamı
alınırsa,
0 1ˆ ˆ ˆ
i i iY n X u
sonucuna ulaşılır. Burada ˆ 0iu olduğu için, denklem
0 1ˆ ˆ
i iY n X
ˆ 0iu
83
şekline indirgenir. Her iki taraf gözlem sayısı n’e bölünürse
( ,i iY n Y X n X eşitliklerinden)
0 1ˆ ˆY X
elde edelir. Sonraki aşamada iY Y oluşturulur.
0 1 0 1
1
1
ˆ ˆ ˆ ˆˆ( ) ( )
ˆ ˆ( )
ˆ ˆ
i i i
i i
i i i
Y Y X u X
X X u
y x u
elde edilir. Yeni elde edilen ana regresyon modelinde Xi veYi yerini kendi örneklem
ortalamalarından sapmalarına ( )i iy Y Y ve ( )i ix X X bırakmıştır. Bundan dolayı
regresyon modelinin sapmalı kalıbı olarak adlandırılır. Bu durumda örnek regresyon
modeli,
1ˆˆ
i iy x 0 1
ˆ ˆY X
ile gösterilir ve
ˆ ˆi i iy y u ve ˆ ˆ
i i iu y y
eşitlikleri geçerlidir.
6. Kalıntılar ile bağımsız değişkenler arasında bir ilişki yoktur, ˆ 0i iu X .
İSPAT (Okuyucunun isteğine bağlı)
Bu durum kalıntıların karelerinin toplamı fonksiyonunda 1 ’e göre birinci mertebeden
kısmi türev alınarak gösterilebilir.
2
i0 1
1
u ˆ ˆ2( )( ) 0ˆ i iY X X
0 1ˆ ˆ( ) ( ) 0i i iY X X
0 1ˆ ˆ( )i i iY X u eşit olduğu için
ˆ 0i iu X
84
7. Kalıntılar( ˆiu ) ile bağımlı değişkenin tahmin edilen değerleri( Y ) arasında ilişki yoktur,
ˆ ˆ 0i iy u .
İSPAT (Okuyucunun isteğine bağlı)
Bu özellik yukarıda elde edilen sapmalı kalıp yardımıyla açıklanabilir.
1ˆˆ ˆ ˆ
i i i iy u x u 1ˆˆ
i iy x
1 1ˆ ˆ( )i i ix y x
2 2
1 1ˆ ˆ
i i ix y x 1 2ˆ i i
i
x y
x
eşitliğinden
2
2
1 2ˆ i i
i i i
i
x yx y x
x
1 1ˆ ˆ 0i i i ix y x y
elde edilir.
3.5. Öngörü
Tahmin edilen regresyon denklemi, öngörü veya geleceği tahmin amaçları için de
kullanılabilir. Örneğin; haftalık geliri 35000 lira olan bir hane halkı için haftalık tüketim
harcaması öngörmek istersek, bu öngörüyü yapmak için X=350 (100 birim) tahmin
denkleminde yerine konulur.
ˆ 17.29 0.61 17.29 0.61(350) 386.4i iY X
Haftalık geliri 35000 lira bir hane halkının, haftalık tüketim harcamasının 386.4 lira
olacağını öngörebiliriz.
85
Uygulamalar
2. Bölümde 60 ailenin haftalık tüketim rakamları ve haftalık harcanabilir gelirlerine
ilişkin hipotetik verilerin yer aldığı ana kütleden “Örnek 1” ve “Örnek 2” olmak üzere iki örnek
çekildiğini hatırlayalım.
60 ailenin haftalık tüketim rakamları ile haftalık harcanabilir gelirler verilerinden
hesaplanan ana kütle regresyon denklemi aşağıdaki gibidir.
( | ) 17 0.6i iE Y X X
Örnek 1 ve Örnek 2 verileri aşağıda verilmiştir. Bu uygulamada her iki örnek verileri
için örnek regresyon fonksiyonu tahmin edilecektir. Not: İşlemlerle basitlik olması amacıyla
ara sonuçlar verilmiştir. Okuyucu verilen ara sonuçları Uygulama 1’de izlenen yolu
uygulayarak hesaplayabilir.
ÖRNEK 1 ÖRNEK 2
Y X Y X
65 80 55 80
80 100 74 100
79 120 90 120
113 140 103 140
125 160 107 160
115 180 135 180
144 200 144 200
157 220 160 220
155 240 189 240
178 260 150 260
Örnek 1 verileri için EKK tahminlerinin elde edilmesi
Örnek 1 için hesaplanan ara sonuçlar aşağıdaki gibidir.
n=10 1211Y 1700iX 2 322000iX 226020i iY X 170X
2 2
0 2 2
2
2
ˆ( )
(1211 322000) (226020 1700)17.29
(10 322000) (1700)
i i i i
i ii
i i
Y X
YX X Y X Y X X
n X Xn X
X X
86
1 2 2
2
2
ˆ( )
(10 226020) (1700 1211)0.61
(10 322000) (1700)
i
i i i i i i i
i ii
i i
n Y
X Y X n Y X X Y
n X Xn X
X X
ˆ 17.29 0.61i iY X
veya
1 2 2 2 2
226020 (10 170 121.1)ˆ 0.61322000 (10 170 )
i i i i
i i
x y X Y nXY
x X nX
0 1ˆ ˆ 121.1 (0.61).170 17.29Y X
ˆ 17.29 0.61i iY X
Beklenildiği üzere En Küçük Kareler yönteminin her iki uygulama biçimi de aynı
sonucu vermiştir.
Örnek 2 verileri için EKK tahminlerinin elde edilmesi
Örnek 2 için hesaplanan ara sonuçlar aşağıdaki gibidir.
n=10 1207Y 1700iX 2 322000iX 226800i iY X 170X 120.7Y
2 2
0 2 2
2
2
ˆ( )
(1207 322000) (226800 1700)9.37
(10 322000) (1700)
i i i i
i ii
i i
Y X
YX X Y X Y X X
n X Xn X
X X
87
1 2 2 2
2
2
ˆ( )
(10 226800) (1700 1207)0.65
(10 322000) (1700)
i
i i i i i i i
i ii
i i
n Y
X Y X n Y X X Y
n X Xn X
X X
ˆ 9.37 0.65i iY X
veya
1 2 2 2 2
226800 (10 170 120.7)ˆ 0.65322000 (10 170 )
i i i i
i i
x y X Y nXY
x X nX
0 1ˆ ˆ 120.7 (0.65).170 9.37Y X
ˆ 9.37 0.65i iY X
Böylece aynı ana kütleden çekilen iki farklı örneğe ait örnek regresyon fonksiyonların
ve regresyon doğrularının farklı olduğu görülmüştür.
En küçük kareler tahminleri, incelenen iktisadi model bağlamında yorumlanır. Haftalık
harcanabilir gelir ile tüketim harcamaları arasındaki ilişkinin araştırıldığı Uygulama 2’de Örnek
1 verilerinden tahmin edilen regresyon doğrusuna ( ˆ 17.29 0.61i iY X ) göre 1ˆ 0.65 değeri,
1 ’nin tahminidir. 2. Bölümden anımsarsak, haftalık harcanabilir gelir 100 lira birimi cinsinden
ölçülmektedir. Matematiksel olarak regresyon doğrusunun eğimini veren 1 , haftalık
harcanabilir gelir 100 lira arttığında, haftalık beklenen tüketim harcamasının artış miktarıdır.
Böylece haftalık gelir 100 lira arttığında, haftalık gıda harcaması 0.61 lira artacağını tahmin
edebiliriz. Tüketim modelinde, gelirdeki 1 birimlik değişmenin tüketimi ne kadar
değiştireceğini gösteren 1 parametresi marjinal tüketim meyli’ni verir. Böylece 1
ˆ 0.65
değeri iktisadi açıdan, örnek 1 verilerden ana kütle marjinal tüketim meylinin tahminini verir.
(Not: Ana kütle marjinal tüketim meyli Örnek 2 verilerinden 0.65 tahmin edilmiştir. )
Regresyon doğrusunun Y eksenini kesim noktası sabit parametre, 0ˆ 17.29 , sıfır gelire
sahip bir hane halkı için haftalık gıda harcamasının tahminidir. Tahmin edilen modele gör sıfır
gelire sahip bir hane halkının haftalık 17.29 lira harcama yapacağını ortaya koymasına karşın,
bu tahmini her zaman kullanmak mümkün değildir. Bölüm 2’de de belirtildiği üzere 0 ’ın bu
yorumu X’in 0 etrafında veri bulmasına bağlıdır ki; biz Örnek 1’de X=0 ‘a yakın herhangi bir
veri noktasına sahip değiliz.
88
Uygulama Soruları
1-5 arasındaki sorular aşağıdaki tablo kullanılarak cevaplandırılacaktır.
X Y
x
X X
2
2
x
X X
y
Y Y
i i
i i
x y
X X Y Y
3 5
2 2
1 3
-1 2
0 -2
X Y x 2x y i i i ix y X X Y Y
1. Tablodaki boşlukları doldurun.
X Y
x
X X
2
2
x
X X
y
Y Y
i i
i i
x y
X X Y Y
3 5 2 4 3 6
2 2 1 1 0 0
1 3 0 0 1 0
-1 2 -2 4 0 0
0 -2 -1 1 -4 4
X 5
Y 10
x 0 2x 10 y 0 i i i ix y X X Y Y 10
n=5 , 5
15
XX
n
, 10
25
YY
n
2. Sapmalar yöntemini ile 0 ve 1 ’in En Küçük Kareler tahminleri hesaplayarak,
yorumlayınız.
1 2
10ˆ 110
i i
i
x y
x
0 1ˆ ˆ 2 1.1 1Y X
Örnek regresyon denklemi
ˆ 1 1i iY X
Yorum: 1ˆ 1 ; X 1 birim arttığında, Y ’de beklenen artış miktarı 1 birimdir.
0ˆ 1 ; X=0 olduğunda Y , 1 birime eşittir. (Not: X sıfır etrafında değer aldığı için bu
yorumu yapabiliriz.
89
3. 2
ix ve i ix y değerlerinin,
2 2 2
i iX X X nX
ve
i i i iX X Y Y X Y nXY değerlerine eşit olduğunu gösteriniz.
Yukarıda hesaplanmış verilerin olduğu tablodan,
22 10i ix X X olduğu bilinmektedir. Bu aşamada
2 2
iX nX ’in
değerini hesaplamalıyız. 2 2
iX nX da yer alan unsurlardan n=5, 1X olup, 2
iX
bilinmemektedir. Öncelikle verilen X değerlerinden 2
iX ’lerin hesaplanması ve toplamının
alınması gerekir. Buna göre;
X X2
3 9
2 4
1 1
-1 1
0 0
X 5 2
iX =15
Böylece;
2 2 215 5(1) 10iX nX ‘dur
22 10i ix X X =
2 2 10iX nX
Eşitliği gösterilmiştir. Benzer olarak i i i iX X Y Y X Y nXY eşitliğini
aşağıdaki gibi göstermek mümkündür.
Tablodan 10i i i ix y X X Y Y olduğu bilinmektedir. i iX Y nXY ’da
yer alan unsurlardan n=5, 1X , 2Y olup, i iX Y ’nin hesaplanması gerekir.
90
X Y XY
3 5 15
2 2 4
1 3 3
-1 2 -2
0 -2 0
X 5 Y 10 XY 20
Böylece;
20 5.1.2 10i iX Y nXY ’dur.
10i i i ix y X X Y Y = 10i iX Y nXY
4. Soru 2’ deki EKK tahminlerinden bağımlı değişkenin tahmini ( Y )değerlerini
hesaplarak aşağıdaki tablodaki boşlukları doldurun.
ˆiY değerlerinin hesaplanabilmesi için iX ’in değerleri ( 3, 2, 1, -1, 0) sırasıyla
ˆ 1 1i iY X regresyon denkleminde yerine konur ve ˆiY ’ler hesaplanır. Buna göre ˆ
iY ’ler;
1ˆ 1 1.3 4Y
2ˆ 1 1.2 3Y
3ˆ 1 1.1 2Y
4ˆ 1 1.( 1) 0Y
5ˆ 1 1.0 1Y olarak hesaplanır. ˆ
iY ’ler hesaplandığına göre kalıntılarda ˆi i iu Y Y
denklemi ile hesaplanabilir. Örneğin 1. Gözlem için 1 1 1ˆˆ 5 4 1u Y Y .
X Y ˆiY ˆ
iu 2ˆiu ˆ
i iX u
3 5
2 2
1 3
-1 2
0 -2
X 5 Y 10 ˆiY ˆ
iu 2ˆiu ˆ
i iX u
91
Lütfen dikkat ediniz:
ˆ 0iu
ˆ 0iY Y dolayısıyla ˆ 2Y Y olacaktır Bağımlı değişkenin
ortalaması bağımlı değişkenin tahmininin ortalamasına eşittir. Yine de Y hesaplamak
istersek ˆ 10ˆ 2
5
iYY
n
.
5. Regresyon doğrusu ve hata terimleri grafiği,
X Y ˆiY ˆ
iu 2ˆiu
3 5 4 1 1
2 2 3 -1 1
1 3 2 1 1
-1 2 0 2 4
0 -2 1 -3 9
X 5 Y 10 ˆiY 10 ˆ
iu 0 2ˆiu 16
92
6-8 arasındaki sorular aşağıdaki tablo kullanılarak cevaplandırılacaktır.
Xi
(1000 ton )
Yi
(100 lira)
1 4
2 6
3 7
4 7
5 9
6 11
6. Regresyon denklemini ( 0 1ˆ ˆˆ
i iY X ) tahmin ederek, sonuçları yorumlayınız.
Öncelikle EKK tahmincileri;
2 2
0 2 2
2
ˆ( )
i i i i
i ii
i i
Y X
YX X Y X Y X X
n X Xn X
X X
1 2 2
2
ˆ( )
i
i i i i i i i
i ii
i i
n Y
X Y X n Y X X Y
n X Xn X
X X
‘deki unsurların hesaplanması gerekir. Gözlem sayısı (n) 6’dır.
Xi
(1000 ton )
Yi
(100 lira)
2
iX i iX Y
1 4 1 4
2 6 4 12
3 7 9 21
4 7 16 28
5 9 25 45
6 11 36 66
21iX 44iY 2 91iX 176i iX Y
2
0 22 2
44 91 176 21ˆ 2.93( ) 6 91 21
i i i i i
i i
Y X Y X X
n X X
1 22 2
6 176 21 44ˆ 1.26( ) 6 91 21
i i i i
i i
n Y X X Y
n X X
ˆ 2.93 1.26i iY X Örnek regresyon denklemi
93
Yorum; X, 1000 ton artığında Y’ de beklenen artış miktarı 126 liradır. X’in dışındaki
faktörlerin Y ‘deki etkisi 293 liradır. (Not: X sıfır etrafında değer almadığı için yorum önceki
uygulamadan farklıdır.)
7. EKK tahminlerini kullanarak, EKK kalıntılarını ( ˆiu ) hesaplayınız.
Kalıntıların ( ˆi i iu Y Y ) hesaplanabilmesi için öncelikle ˆ
iY değerlerinin bilinmesi
gerekir. ˆiY değerlerinin hesaplanabilmesi için iX ’in değerleri ( 1,2,3,4,5,6) sırasıyla
ˆ 2.93 1.26i iY X regresyon denkleminde yerine konur ve ˆiY ’ler hesaplanır. Buna göre örneğin
1. Gözlem için
ˆ 2.93 1.26 2.93 1.26 1 4.19i iY X
Yi
(100 lira) ˆiY ˆ
iu 2ˆiu
4 4.19 -0.19 0.0361
6 5.45 0.55 0.3025
7 6.71
0.29 0.0841
7 7.97 -0.97 0.9409
9 9.23 -0.23 0.0529
9 10.49 0.51 0.2601
44iY 44iY ˆ 0.04iu **** 2ˆ 1.6766iu
****Kalıntıların toplamı ( ˆiu ) sıfır olmalıdır. Burada ( 0.04 )olmasının nedeni 0
2.93333… olduğu halde yaklaşık 0 2.93 alınmış olmasıdır.
8. iX X ve 12iX için Y’nin öngörü değerleri nedir.
iX X için, öncelikle X ’nın hesaplanması gerekir.
21
3.56
XX
n
ˆ 2.93 1.26 2.93 1.26(3.5) 7.34i iY X
12iX için
ˆ 2.93 1.26 2.93 1.26(12) 18.05i iY X
94
9. 12 gözlem için veriler kullanılarak aşağıdaki ara sonuçlar hesaplanmıştır.
EKK yöntemini kullanarak örnek regresyon modelini oluşturunuz.
480iY , 36iX , 440i ix y , 2 20ix
Yukarıdaki veriler göre öncelikle EKK yönteminin hangi uygulama biçimini
kullanacağınızı doğru tespit etmeniz gerekir. Yukarıdaki verileri kullanarak normal denklemler
aracılıyla modeli tahmin edemezsiniz. Çünkü normal denklemlerin unsurlarından i iX Y ,
2
iX verilmemiş. Ancak EKK’in ortalamadan sapmalara göre uygulaması ile parametreleri
tahmin etmeniz mümkün. Şöyle ki;
Önce örnek regresyon modelini yazalım.
0 1ˆ ˆˆ
i iY X
EKK yönteminin sapmalar kuralına göre uygulamasında önce 1 ’in tahmin edilmesi gerekir.
1 ’in EKK tahmincisi aşağıdaki gibidir.
1 2ˆ i i
i
x y
x
440i ix y ve 2 20ix verildiğine göre
1 2
440ˆ 2220
i i
i
x y
x
Bu aşamada aşağıdaki EKK tahmincisi ile 0 ' ı tahmin etmemiz gerekir.
0 1ˆ ˆY X
Burada 1ˆ 22 olduğu bilinmekte, ancak Y ve X bilinmemektedir. Ancak yukarıdaki
verilerden hesaplanabilir. Gözlem sayısı 12 olduğuna göre Y ve X aşağıdaki gibi hesaplanır.
48040
12
iYY
n
ve 36
312
iXX
n
Böylece;
0 1ˆ ˆ 40 ( 22 3) 106Y X
Örnek regresyon fonksiyonu;
ˆ 106 22i iY X
X, 1 birim artarsa Y 22 birim azalacaktır, X’in dışındaki diğer faktörlerin Y üzerindeki etkisi
ortalama 106 birimdir. Veya X=0 olduğunda Y 106 birim olacaktır (Bu yorum X’in 0 etrafında
veri bulmasına bağlıdır, ancak bize gözlemlenen (teorik) veriler verilmemiş, sadece ara
sonuçlar verilmiştir.)
95
10. Aşağıda tahmin edilmiş tasarruf fonksiyonunu kullanarak marjinal tüketim
meylini (MCM) hesaplayın.
ˆ 1.2 0.2t tS Y S=Tasarruf, Y= Gelir
Yukarıdaki tasarruf modelinde 0.2 marjinal etkiyi göstermekte ve gelir 1 birim arttığında
tasarrufların 0.2 birim artacağını ifade etmektedir. Burada 0.2 marjinal tasarruf meylidir
(MSM). İktisat derslerimizden,
MCM+MSM=1
olduğunu bildiğimize göre marjinal tüketim meyli (MCM) 0.8’e eşittir.
96
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde küçük kareler yaklaşımının her iki uygulama yöntemine göre ana kütle
parametrelerinin nasıl tahmin edileceğini öğrendik. Kalıntıların nasıl hesaplandığını ve ana
kütle hata teriminin tahmini olan kalıntıların da toplamının sıfır olduğunu gördük. En küçük
kareler regresyon doğrusunun nasıl çizileceğini, diğer bir ifade ile EKK regresyonunun cebrini
öğrendik. Tahmin edilen parametrelerin nasıl yorumlandığını gördük. Örnek regresyon
fonksiyonunu kullanarak bağımsız değişkenin verilen bir değeri için bağımlı değişkenin
değerini öngördük. En küçük kareler yönteminin özelliklerini öğrendik ki; bu özellikleri ileriki
derslerimizde kullanacağız. BLUE tahminin ne anlama geldiğini öğrendik. Tahminci ile tahmin
arasındaki fark üzerinde durduk.
97
Bölüm Soruları
1-7 arası sorular için aşağıdaki tablo kullanılacaktır.
Gözlem Y X
1 2 1
2 3 5
3 4 4
4 6 10
5 10 20
6 20 50
1. X , Y’nin nedeni olduğu bilgisine sahip olduğunuz varsayımı altında örnek
regresyon fonksiyonunun oluşturunuz.
a) ˆ 5.37 2.72i iY X
b) ˆ 0.47 1.02i iY X
c) ˆ 5.37 2.72i iX Y
d) ˆ 2.02 0.37i iY X
e) ˆ 2.37 1.22i iX Y
2. X’in birimi 100 lira Y’in birimi 10 ton ise modelin yorumu hangisidir?
a) X ’deki 1 brimlik artış Y’yi 2.37 ton arttırır.
b) X ’deki 100 liralık artış Y’yi 1.02 brim arttırır.
c) X ’deki 100 liralık artış Y’yi 27.2 ton arttırır.
d) X ’deki 100 liralık artış Y’yi 3.7 ton arttırır.
e) X ’deki 1birimlik artış Y’yi 1.22 birim arttırır.
3. Kalıntıların karelerinin toplamı nedir?
a)1.78
b)3.08
c) 40.9
d) 31.09
e) 13.21
4. i ix y =? ( i ix X X , i iy Y Y )
a) 0
b)1280
c) 820
d)139
e) 618
98
5. 2 ?ix ( i ix X X )
a) 227.5
b) 57.8
c) 43.9
d) 0
e) 90
6. 2 ?iy ( i iy Y Y )
a) 45
b) 27
c) 0
d) 1692
e) 23.5
7. Kalıntıların toplamı kaçtır?
a) Hesaplanamaz
b) 1
c) 8.8
d) 0
e) 12.6
8. 0 1ˆ ˆˆ
i iY X modeli için aşağıdakilerden hangisi 1 ’in bir tahmincisi
değildir?
a) 2
1ˆ
i i ix y x
b) 2
1ˆ
i i ixY x
c) 2
1ˆ
i i iX Y X
d) 2
1ˆ
i i iX y x
e) 1 2 2ˆ
( )
i i i i
i i
n Y X X Y
n X X
9. Aşağıdaki ifadelerden hangisi yanlıştır?
a) Bağımlı değişkenin gözlemlenen değerlerinin ortalaması, Bağımlı değişkenin tahmini
değerlerinin ortalamasına eşittir.
b) En küçük kareler yöntemi normallik varsayımına dayanmaktadır.
c) Örnek regresyon doğrusu ( X ,Y ) noktasından geçer.
d) Kalıntıları ortalaması sıfırdır.
e) En küçük kareler yöntemi kalıntılar kareler toplamının minimum olmasına
dayanmaktadır.
10. Aşağıdakilerden hangisi yanlıştır?
99
a) EKK tahmincilerini elde etmek için kalıntı kareler toplamının fonksiyonu sıfıra
eşitlenir ve tahmin edilecek parametrelere göre türev alınır.
b) Kalıntılar ile X bağımsız değişkeninin çarpımlarının toplamı sıfırdır, bu ana kütlede
hata terimleri ile X bağımsız değişkeninin ilişkisiz olduğu varsayımına denktir.
c) 0 1ˆ ˆY X ’in kullanımı örnek regresyon doğrusunun ( X ,Y ) doğrusundan geçtiği
varsayımına dayanır.
d) EKK yöntemini uygulayabilmemiz için bağımlı değişkenin dağılımı hakkında bilgi
sahibi olmamız gerekir.
e) EKK yöntemini sıfır ve ortalamalar orijinine göre uygulamasının sonuçları aynıdır.
Cevaplar
1) d
2) d
3) a
4) e
5) a
6) d
7) d
8) c
9) b
10) d
100
4. EN KÜÇÜK KARELER
TAHMİNCİLERİNİNDEĞERLENDİRİLMESİ
101
Bu Bölümde Neler Öğreneceğiz?
4.1. En Küçük Kareler Tahmincilerinin Değerlendirilmesi
4.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları
4.3. Hata Teriminin Varyansının Tahmini
4.4. Uygulama: Satış Gelirleri ile Reklam Harcamaları
4.5. Esneklikler
4.6 Uygulama: Satış Gelirleri ile Reklam Harcamaları
102
Bölüm Hakkında İlgi Oluşturan Sorular
1) Örnek verilerinden tahmin ettiğimz parametrelere güvenebiliriz miyiz?
2) Bunun için bir ölçü var mıdır?
3) Ekonometrik modelin sonuçlarından esneklik hesaplanabilir mi? Sonuçları nasıl
yorumlanır?
103
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde edileceği
veya geliştirileceği
Tahmin edilen
parametrelerin Varyans
kovaryanslarının
hesaplanması
Tahmin edilen
paremetrelerinin
güvenirliliğini kavramak
Ders notları ve uygulamaların
tekrar edilmesi
Tahmin edilen bir
modelden ortalama
esneklik ve nokta
esnekliği
hesaplayabilmek ve
yorumlamak
İktisatta derslerinde de
üzerinde durulan talebin gelir
esnekliği, talebin fiyat
esnekliği gibi ölçülerin
ekonometrik modelden
hesaplamak ve yorumlamak
Ders notları ve uygulamaların
tekrar edilmesi
104
Anahtar Kavramlar
Varyans
Kovaryans
Hata teriinin varyansı
Ortalama esneklik
Nokta esneklik
105
Giriş
Basit regresyon modelinde parametrelerin EKK yöntemi ile nasıl tahmin edildiğini
öğrendik. Bu alt bölümden itibaren tahmin ettiğimiz bu parametrelere güvenebilir miyiz?
sorusunun cevabını arayacağız. Bu bağlamda tahmin edilen parametrelerin standart hataları
parametrenin güvenirliliği konusunda bir ölçü oluşturmaktadır. Ekonometrik analizin nihai
hedefleri olan hipotez testi ve aralık tahminleri için tahmin edilen parametrenin standart
hatasının bilinmesi gerekir. Bu bölümde tahmin edilen parametrelerin varyans ve
kovaryanslarının nasıl hesaplanacağı üzerinde durulacaktır.
Ayrıca tahmin edilen regresyon modeli sonuçlarına dayanarak nokta ve ortalamaya
göre esneklikler hesaplanacak ve yorumlanacaktır.
106
4.1. En Küçük Kareler Tahmincilerinin Değerlendirilmesi
2. Bölümde 60 ailenin harcanabilir gelir ve tüketim harcamalarının yer aldığı ana kütleyi
tanıtmış, 3. Bölüm Uygulamada bu ana kütleden çekilen iki örnek verileri kullanılarak,
0 1i i iY X u regresyon modeli için iki ayrı parametre tahminleri elde etmiştik. Elde
edilen sonuçlara göre, 0 ve 1 ’in EKK tahminlerinin ( 0 ve 1 ) örnekten örneğe değiştiği
görülmüştür (Hatırlatma; Örnek 1 için ˆ 17.29 0.61i iY X , Örnek 2 için ˆ 9.37 0.65i iY X ).
“Bu tahminlerin hangisi daha iyi?” sorusunu sormak doğaldır ancak bu soru cevaplanamaz.
Çünkü ana kütle parametreleri 0 ve 1 ’in gerçek değerleri bilinemediği için 0 ve 1
parametrelerinin gerçek ana kütle değerlerine ne kadar yakın olduğunu söylemek olanaksızdır.
Örnek 1 ve Örnek 2 ’deki gibi aynı gelir gruplarına sahip hane halklarını seçilmiş bile,
farklı bir ( 0 ve 1 ) tahminleri elde edilmesi örnekleme değişkenliği’nden kaynaklanmakta
olup, bu örnekleme değişkenliği kaçınılmazdır. Bir tahmincinin örnekleme doğruluğunu ve
güvenilebilirliğini değerlendirmek açısından örnekleme değişkenliğini anlamak önem arz eder.
Hane halkı tüketim harcamaları, Yi, i=1,....,60 rassal değişkenler olduğu için, farklı örnekler
farklı tahminler verecektir. Sonuç olarak, bir tahmin süreci olarak düşündüğümüzde ( 0 ve 1
) ’de rassal değişkenlerdir, çünkü değerleri Y rassal değişkenine bağlıdır. Bu bağlamda 0 ve
1 EKK tahmincileri olarak isimlendirilir. En küçük kareler tahmincileri 0 ve 1 rassal
değişkenler ise, bu durumda, bunların beklenen değerleri, varyansları, kovaryansları ve olasılık
dağılımları ( 0 ve 1 ) tahmincilerinin örnekleme özellikleri ile ilgilidir.
4.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları
Bir tahmincinin varyansı, tahminlerin örnekten örneğe ne kadar değiştiğini kısaca
tahmincinin doğruluğunu ölçer. Bir tahmincinin daha küçük varyansı, o tahmincinin daha fazla
örnekleme doğruluğu anlamına gelmektedir. Bir tahmincinin örnekleme varyansı, diğer
tahmincininkinden daha küçükse, diğer tahminciden daha iyidir (doğrudur, tesirlidir) .
Basit regresyon modeli varsayımları 1-5 varsayımları 0 ve 1 ’nin varyans ve
kovaryansları aşağıdaki gibidir:
2
2
0 2ˆ( )
i
i
XVar
n x
2
1 2ˆ( )
i
Varx
107
2
0 1 2ˆ ˆ( , )
i
XCov
x
Yukarıda verilen varyans ve kovaryansı tahmincilerini etkileyen faktörleri aşağıdaki
gibidir.
Rassal hata terimi 2 , varyans ve kovaryans denklemlerinin her birinde yer almaktadır.
Rassal hata terimi gözlemlen Y değerlerinin beklenen değerleri
( ) i iE Y E Y X X E Y X etrafında yayılımını yansıtmaktadır. Daha büyük varyans
2 , daha fazla yayılım anlamına gelmektedir. Y değerlerinin ortalamalarına ( )E Y göre uzağa
düştüğü durum belirsizliğin daha fazla olması anlamına gelmektedir. 2 nin daha büyük olduğu
zaman,0 ve
1 hakkında sahip olduğumuz bilginin doğruluğu daha azdır. İstatistikte varyans
belirsizlik ölçüsü olduğu için, daha büyük varyans ( 2 ) en küçük kareler varyans ve
kovaryanslarının da daha büyük olması anlamına gelmektedir.
X değerlerinin ortalamaları etrafındaki kareleri toplamı2 2( )i ix X X
yukardaki varyans ve kovaryans denklemlerinin her birinde yer almaktadır. Bu ifade, bağımsız
veya açıklayıcı değişken X’in örnek değerlerinin, ortalamaları etrafında nasıl yayıldığını ölçer.
Bunlar, daha geniş yayıldıkça, daha büyük kareler toplamı ortaya çıkar. Aynı şekilde, bunlar,
daha dar bantta yayıldıkça, daha küçük kareler toplamı ortaya çıkar. Daha büyük kareler
toplamı 2
ix , en küçük kareler tahmincilerinin daha küçük varyansı anlamına gelip,
bilinmeyen parametreleri daha doğru bir şekilde tahmin edebiliriz. Bu durumda X değerleri, X-
ekseni boyunca genişçe yayılım göstermektedir. 2
ix verisi küçük ise veri belli bir noktada
“toplanmış”tır.
Daha büyük örnek büyüklüğü n, daha küçük EKK tahmincileri varyans ve
kovaryansları anlamına gelir. Daha büyük örnek verisi, daha küçük örnek verisinden daha
iyidir. Örnek büyüklüğü n yukardaki varyans ve kovaryans denklemlerinin her birinde yer
almaktadır, çünkü toplamların her biri, n terimden oluşmaktadır. Ayrıca n, 0( )Var ’da açıkca
görülmektedir.,n arttıkça kareler toplamı terimi (2
ix ) daha büyür çünkü, toplamdaki her bir
terim pozitif veya sıfırdır ( X’in bir gözlem değeri, örnek ortalamasına eşit olursa, toplam sıfır
ortaya çıkar, 2 2( ) 0i ix X X . Sonuç olarak, n daha büyük oldukça, hem 0( )Var hem
de 0 1( , )Cov daha küçük olur, kareler toplamı, paydalarında yer almaktadır. 0( )Var ın pay
ve paydasındaki toplamların her ikisi de n büyüdükçe, artarlar ve birisindeki artış diğeri
tarafından dengelenir, ancak belirleyici terim olarak paydadaki n denklemde yerini konulunca
ve n daha büyüdükçe, 0( )Var daha da küçüleceği kesindir.
108
2
iX terimi 0( )Var ’da yer almaktadır. Bu terim büyüdükçe, en küçük kareler
tahmincisi 0 ’ın varyansı büyür. Çünkü sabit parametre 0 , X=0 iken Y’nin beklenen
değeridir, 00E Y X . X=0’dan daha uzağa verilerimiz düşerse, tüketim harcaması
örneğinde olduğu gibi, 0 ’ı yorumlamak daha zor olacaktır ve 0 ’ı doğru bir şekilde tahmin
etmek de daha zor olacaktır. 2
iX terimi, X’in orjinden (X=0) olan kareli uzaklığı ölçer. X
değerleri, sıfıra yaklaşırsa, bu durumda, 2
iX daha küçük olacak ve bu 0( )Var ’ı
azaltacaktır. Fakat pozitif veya negatif, X değerleri büyük olursa, diğer şartlar sabitken, 2
iXdaha büyük olacak ve bu 0( )Var ’ı daha büyük olacaktır.
X-değerlerinin örnek ortalaması, 0 1( , )Cov ’de yer almaktadır. Kovaryansın mutlak
büyüklüğü, örnek ortalaması X ’ın büyüklüğündeki artışla artış gösterir ve kovaryans X ’ın
işaretinin tersi bir işarete sahiptir. Bunun sebebi, EKK regresyon doğrusunun X ve Y’nin
ortalama noktalarından geçmek zorunda olmasıdır.
Yukarıda verilen varyans ve kovaryans formüllerinde yer alan ana kütle hata teriminin
Varyansı ( 2 ) bilinmemekte, örnek verilerinden tahmin ( 2 ) edilmektedir. Varyans ve
kovaryans ormüllerinde bu tahmin değeri anakütle hata teriminin varyansı yerine konmaktadır.
Tahmin edilen varyansların kare kökleri, 0 ve 1 ’in “standart hataları”dır. Bu
sayılar, hipotez testi ve aralık tahmininde kullanılır. Bu standart hatalara aşağıda görüldüğü
gibi, 0ˆ( )Se ve 0
ˆ( )Se olarak gösterilir.
0 0ˆ ˆ( ) ( )Se Var
1 1ˆ ˆ( ) ( )Se Var
0 ve 1 ’in standart hataları, EKK tahminleri 0 ve 1 ’in örnekleme değişkenliğinin
ölçümleridir. Daha önce gösterildiği gibi, farklı veri örnekleri topladığımızda, parametre
tahminleri örnekten örneğe değişir. 0 ve 1 ’in tahmincileri, örnek verileri nasıl oluşursa
oluşsun kullanılan genel formüllerdir. Yani tahminciler, rassal değişkenlerdir. Bu sebeple,
olasılık dağılımlarına, ortalamalara ve varyanslara sahiptirler. Özellikle, hata terimlerinin
normal dağıldığı varsayımı sağlanırsa diğer bir ifade ile rassal hata terimleri iu normal
dağılırsa, bu durumda0 ve 1 aşağıdaki gibi normal dağılacaktır.
109
2 2
0 0 0 2ˆ ˆ, ( )
i
i
XN Var
n x
2
1 1 1 2ˆ ˆ, ( )
i
N Varx
4.3. Hata Terimi Varyansının Tahmini
Ana kütle parametrelerinin tahmininden sonra, bilinmeyen ve örnek verilerinden tahmin
edilmesi gereken diğer bir unsur sabit olduğu varsayılan ana kütle hata teriminin varyansıdır.
Klasik doğrusal regresyon modelinin temel varsayımlarından biri gözlemler (alt ana kütle)
itibariyle hata teriminin varyansının eşit olmasıdır. Hata teriminin beklenen değerinin sıfır
olduğu varsayımı ( 0iE u ) doğru ise, iu ’nin varyansı aşağıdaki gibidir.
22 2( )i i i iVar u E u E u E u ( ) 0iE u
“Beklenti” ortalama bir değer olduğu için, tahmin edilen 2 ’yi, hata karelerinin
ortalaması olarak aşağıdaki gibi düşünülebilir.
2
2 iu
n
Ana kütle bilinmediği için rassal hatalar iu gözlemlenemeyecek bu nedenle yukarıdaki
formülün kullanımı söz konusu olmayacaktır. Ancak bilinmeyen rassal hataların yerine
örnekten hesaplanan EKK kalıntıları kullanılabilir. Böylece, rassal hatalar ile kalıntılar yer
değiştirerek hata terimi varyansının tahmini için aşağıdaki gibi kullanılabilir,
2
2ˆ
ˆ iu
n
Büyük örneklerde oldukça tatmin edici olmasına karşın, bu tahminci, 2 ’nın sapmalı
bir tahmincisidir. Fakat sapmasız tahminciyi elde etmek için basit bir değişiklik aşağıdaki gibi
yapılır,
2
2ˆ
ˆ2
iu
n
Paydada çıkarması yapılan 2, modeldeki regresyon parametreleri ( 0 ve 1 ) ’lerin
sayısı olup, bu çıkarım, 2 ’yi sapmasız yapar böylece,
2 2ˆE
olur.
110
4.4. Uygulama: Satış Gelirleri İle Reklam Harcamaları
Satışlar ile reklam harcamaları arasındaki doğrusal ilişki örnek verilerinden
ˆ 1.0 1.2i iY X ve 2ˆiu =8.8
olarak hesaplanmıştı. Şimdi 0 ve 1 ’in varyansları, standart hatalarını ve 0 ve 1
arasındaki kovaryansı hesaplayacağız.
2
2
0 2ˆ ˆ( )
i
i
XVar
n x
2
1 2
ˆˆ( )i
Varx
2
0 1 2ˆ ˆ ˆ( , )
i
XCov
x
0ˆ( )Var , 1
ˆ( )Var ve 0 1ˆ ˆ( , )Cov ’in hesaplanabilmesi için öncelikle hata terimi
varyansının tahmin edilmesi gerekir. Hata terimi varyansının tahmini ( 2 ) aşağıdaki gibidir.
2
2ˆ 8.8 8.8
ˆ 2.932 5 2 3
iu
n
2
iX 55 ,
2 10ix , 3X olduğu bilindiğine göre;
2
2
0 2
55ˆ ˆ( ) 2.93 3.2235.10
i
i
XVar
n x
2
1 2
ˆ 2.93ˆ( ) 0.29310i
Varx
2
0 1 2
3ˆ ˆ ˆ( , ) 2.93 0.87910i
XCov
x
0 ve 1 ’in standart hataları ise,
0 0ˆ ˆ( ) ( ) 3.223 1.795Se Var
1 1ˆ ˆ( ) ( ) 0.293 0.541Se Var
111
olarak hesaplanır. Şu ana kadar yaptığımız hesaplamalar toplu biçimde aşağıdaki gibi
raporlanır.
2ˆ ˆ1.0 1.2 2.93 5
( ) (1.795)(0.541)
i i
i
Y X n
Se
4.5. Esneklikler
Gelir esneklikliği, gelirdeki değişimler karşısında tüketicinin tepkisini göstermektedir.
Doğrusal bir ilişkide Y değişkenin, X değişkenine göre esnekliği aşağıdaki gibi hesaplanır:
'deki yüzdedeğişim
'deki yüzdedeğişim
Y Y Y Y X
X X X X Y
0 1i iE Y X X X ile verilen doğrusal ekonomik modelde, 1 ’i aşağıdaki gibi
tanımlamıştık.
1
E Y
X
Bu durumda, gelire göre ortalama harcama esnekliği aşağıdaki gibi hesaplanır:
1
E Y E Y E Y X X
X X X E Y E Y
Esnekliği hesaplamak için 1 yerine, örnek verilerinden hesaplanan 1 gelir. Ayrıca “X
” ve “ E Y ” de değiştirilmek zorundadır. Çünkü doğrusal bir modelde esneklik, regresyon
doğrusu boyunca her bir noktada farklıdır. Çoğunlukla, esneklik “ortalamalar noktasından
,X Y hesaplanır, çünkü regresyon doğrusunda bu uygun bir temsil noktasıdır. Buna göre
ortalamalar noktasında gelir esnekliğini hesaplamak istersek aşağıdaki formül kullanılır.
1ˆˆ
X
Y
Ortalamaya göre esneklik hesaplanabileceği gibi X’in belli bir değere eşit ( iX X )
olduğu nokta için de hesaplanabilir. Bu durumda iX X olduğu noktada regresyon
denkleminden ˆiX XY ’nin hesaplanması gerekir.
0 1ˆ ˆˆ
iX X iY X
Buradan esneklik,
112
1ˆˆ
ˆi
i
X X
X
Y
formulü ile hesaplanır.
4.6. Uygulama: Satış Gelirleri İle Reklam Harcamaları
Satış Gelirleri ile reklam harcamaları örnek verilerinden aşağıdaki sonuçlara
ulaşılmıştı.
ˆ 1.0 1.2i iY X 4.6Y 3X
Yukarıdaki sonuçlara göre, ilk olarak satışların reklam harcamalarına göre ortalama
esnekliğini hesaplayalım. X ve Y örnek ortalama değerler ( , ) (3,4.6)X Y olduğuna göre
satışların reklam harcamalarına göre ortalama esnekliği aşağıdaki gibi hesaplanmaktadır.
1
3ˆˆ 1.2 0.784.6
X
Y
( , ) (3,4.6)X Y alındığında, reklam harcamalarındaki %1’lik bir artış, satışlarda
ortalama %0.78’lik bir artışa yol açar. Tahmin edilen reklam harcamaları esnekliği birden
küçük olduğu için, satışların arttırılması için reklam harcamalarının zorunlu olduğu sonucunu
çıkarmak mümkündür.
İkinci olarak X=5 olduğu noktada satışların reklam harcamalarına göre ortalama
esnekliğini hesaplayalım. X=5 ise ˆ 1.0 1.2 5 7iY ’dir. ˆ( , ) (5,7)ii xX Y noktasında
satışların reklam harcamalarına göre esnekliği aşağıdaki gibi hesaplanmaktadır.
1
5ˆˆ 1.2 1ˆ 6
i
i
X X
X X
Y
ˆ( , ) (5,7)ii xX Y noktasında birim esneklik söz konusudur. Reklam harcamalarındaki
%1’lik bir artış, satışlarda %1’lik bir artışa yol açar
113
Uygulamalar
1. Amaç, ikinci bölümde hipotetik verileri verilen ve üçüncü bölümde Örnek 1 ve
Örnek 2 verilerinden ana kütle parametrelerinin tahmin edildiği modellerde yer alan
parametrelerin varyans ve kovaryanslarının hesaplanmasıdır.
Dikkat edilecek olursa bu uygulamada ara sonuçlardan hareket ettiğimiz için 2
iu’ne sahip değiliz. Öncelikle ˆ 17.29 0.61i iY X denkleminde X ’in değerleri yerine
konur, ˆiY ’ler hesaplanır. Daha sonraki aşamada ˆiu ,
2ˆiu ve
2
iu hesaplanır.
ÖRNEK 1
iY iX ˆiY ˆ
iu 2ˆiu
65 80 66.09 -1.09 1.1881
80 100 78.29 1.71 2.9241
79 120 90.49 -11.49 132.0201
113 140 102.69 10.31 106.2961
125 160 114.89 10.11 102.2121
115 180 127.09 -12.09 146.1681
144 200 139.29 4.71 22.1841
157 220 151.49 5.51 30.3601
155 240 163.69 -8.69 75.5161
178 260 175.89 2.11 4.4521
1211iY 1700iX ˆ 1209.9iY ˆ 1.1iu 2ˆ 623.321iu
Önemli not: ˆ 0iu , ˆ 1211i iY Y olarak hesaplanması gerekir. Hesaplamalardaki
ufak farklılıklar, ˆ 17.29 0.61i iY X denkleminde virgülden sonra iki hane alındığı içindir.
Hata terimi varyansının tahmini ( 2 ) aşağıdaki gibidir.
2
2ˆ 623.321 623.321
ˆ 77.922 10 2 8
iu
n
2 322000iX , 170X ,
2 33000ix olduğu bilindiğine göre;
114
2
2
0 2
322000ˆ ˆ( ) 77.92 76.0310 33000
i
i
XVar
n x
2
1 2
ˆ 77.92ˆ( ) 0.00236133000i
Varx
2
0 1 2
170ˆ ˆ ˆ( , ) 77.92 0.40133000i
XCov
x
0 ve 1 ’in standart hataları ise,
0 0ˆ ˆ( ) ( ) 76.03 8.72Se Var
1 1ˆ ˆ( ) ( ) 0.002361 0.049Se Var
olarak hesaplanır. Şu ana kadar yaptığımız hesaplamalar toplu biçimde aşağıdaki gibi
raporlanır.
2ˆ ˆ17.29 0.61 77.92 10
( ) (8.72)(0.049)
i i
i
Y X n
Se
Örnek 2
ˆ 9.37 0.65i iY X
ÖRNEK 2
iY iX ˆiY ˆ
iu 2ˆiu
55 80 61.37 -6.37 40.5769
74 100 74.37 -0.37 0.1369
90 120 87.37 2.63 6.9169
103 140 100.37 2.63 6.9169
107 160 113.37 -6.37 40.5769
135 180 126.37 8.63 74.4769
144 200 139.37 4.63 21.4369
160 220 152.37 7.63 58.2169
189 240 165.37 23.63 558.3769
150 260 178.37 -28.37 804.8569
1211iY 1700iX 11 8.7ˆ 9iY ˆ 8.3iu 2 1612 4 9ˆ . 8iu
115
Önemli not: ˆ 0iu , ˆ 1211i iY Y olarak hesaplanması gerekir. Hesaplamalardaki ufak
farklılıklar, ˆ 9.37 0.65i iY X denkleminde virgülden sonra iki hane alındığı içindir.
Hata terimi veryansının tahmini ( 2 ) aşağıdaki gibidir.
2
2ˆ
ˆ 201.562 1
1612.489 1612.48
0 2 8
9iu
n
2 322000iX , 170X ,
2 33000ix olduğu bilindiğine göre;
2
2
0 2196.
322000ˆ ˆ( ) 201.5610 330
50
670
i
i
XVar
n x
2
1 2
ˆ 201.50.
6ˆ( )3
000
03 0
6i
Varx
2
0 1 2
170ˆ ˆ ˆ( , ) 201. 1.0385633000i
XCov
x
0 ve 1 ’in standart hataları ise,
0 0ˆ ˆ( ) ( ) 196.6 14 0275 .Se Var
1 1ˆ ˆ( ) ( ) 0.006 0.08Se Var
olarak hesaplanır. Şu ana kadar yaptığımız hesaplamalar toplu biçimde aşağıdaki gibi gösterilir.
2ˆ ˆ9.37 0.65 201.56 10
( ) (14.02)(0.08)
i i
i
Y X n
Se
Sonuç: Yukarıdaki sonuçlara göre parametre tahminlerin standart hataları Örnek 1’de,
Örnek 2’den daha küçük hesaplanmıştır. Buna göre Örnek 1, Örnek 2’ye tercih edilir.
2. Tüketim Modeli için esnekliklerin hesaplanması
Örnek 1
ˆ 17.29 0.61i iY X 121.1 170Y X
Ortalamalar noktasında - ( , ) (170,121.1)X Y - gelir esnekliği aşağıdaki aşağıdaki gibi
hesaplanır.
1
170ˆˆ 0.61 0.86121.1
X
Y
116
X ve Y örnek ortalama değerlerini ( , ) (170,121.1)X Y aldığında, hane halkı gelirindeki
%1’lik bir artış, ortalama olarak hane halkı tüketim harcamasında %0.86’lık bir artışa yol açar.
Tahmin edilen gelir esnekliği birden küçük olduğu için, tüketim harcamaları “lüks” değil
“zorunlu” dur -ki bu sonuç, ortalama bir hane halkı için beklentilerimizle ile tutarlıdır.
İkinci olarak X=160 olduğu noktada ortalama gelir esnekliğini hesaplayalım. X=160 ise
ˆ 17.29 0.61 160 114.89iY ’dur. ˆ( , ) (160,114,89)ii xX Y noktasında gelir esnekliği
aşağıdaki gibi hesaplanmaktadır.
1
160
160 160ˆˆ 0.61 0.85ˆ 114.89X
X
Y
Gelirin 160 olduğu noktada tüketimin gelir esnekliği 0.85’e eşittir. Diğer bir ifade ile gelir %1
artarsa, tüketim %0.85 artacaktır.
Örnek 2
ˆ 9.37 0.65i iY X 120.7 170Y X
Ortalamalar noktasında - ( , ) (170,120.7)X Y - gelir esnekliği aşağıdaki aşağıdaki gibi
hesaplanır.
1
170ˆˆ 0.65 0.92120.7
X
Y
X ve Y örnek ortalama değerlerini ( , ) (170,120.7)X Y aldığında, hane halkı gelirindeki
%1’lik bir artış, ortalama olarak hane halkı tüketim harcamasında %0.92’lık bir artışa yol açar.
Bu örnek verilerinden de tahmin edilen gelir esnekliği birden küçük olduğu için, tüketim
harcamaları “lüks” değil “zorunlu” dur.
İkinci olarak X=220 olduğu noktada ortalama gelir esnekliğini hesaplayalım. X=220 ise
ˆ 9.37 0.65 220 152.37iY ’dir. ˆ( , ) (220,152.37)ii xX Y noktasında gelir esnekliği
aşağıdaki gibi hesaplanmaktadır.
1
220
220 220ˆˆ 0.65 0.94ˆ 152.37X
X
Y
ˆ( , ) (220,152.37)ii xX Y noktasında hane halkı gelirindeki %1’lik bir artış, hane halkı
tüketim harcamasında %0.94’lük bir artışa yol açar.
117
Uygulama Soruları
Aşağıdaki veriler kullanılarak,
Gözlem Satış (100 lira) Fiyat (1 lira)
1 6 10
2 4 20
3 5 30
4 4 40
5 3 50
6 1 60
2 2
2 2
23 , 210 , 35 , 3.83
660 , 9100 , 103
14.83 , 1750 , 145
i i
i i i i
i i i i
Y X X Y
X Y X Y
y x x y
Ara sonuçlar hesaplanmış, buradan örnek regresyon denklemi tahmin edilmiş ve kalıntıların
karelerinin toplamı hesaplanmıştır.
ˆ 6.73 0.08i iY X 2ˆ 2.82îu
Not: Yukarıdaki verileri kullanarak ara sonuçları ve regesyon fonksiyonunu siz de elde edin.
1. Ana kütle hata teriminin varyansını tahmin ediniz?
Ana kütle hata terimi varsayının tahmicisinin2 2ˆ ˆ 2îu n olduğu bilindiğine göre;
2
2ˆ 2.82 2.82
ˆ 0.7052 6 2 4
îu
n
olarak tahmin edilir.
2. 0ˆ 6.73 olarak tahmin edilen 0 parametresinin varyansını tahmin ederek,
standart hatasını hesaplayınız.
Yukarıda hesapladığımız ara sonuçları kullanarak 0 parametresi için varyans
tahminini bulabiliriz.
2
2
0 2
9100ˆ ˆ( ) 0.705 0.6116 1750
i
i
XVar
n x
118
0 0ˆ ˆ( ) ( ) 0.611 0.782Se Var
3. 1ˆ 0.08 olarak tahmin edilen 1 parametresinin varyansını tahmin ederek,
standart hatasını hesaplayınız.
Yukarıda hesapladığımız ara sonuçları kullanarak 1 parametresi için varyans
tahminini bulabiliriz.
2
1 2
ˆ 0.705ˆ( ) 0.00041750i
Varx
1 1ˆ ˆ( ) ( ) 0.0004 0.02Se Var
4. 0 ile 1 arasındaki ortakvaryansı hesaplayınız.
2
0 1 2
35ˆ ˆ ˆ( , ) 0.705 0.01411750i
XCov
x
5. 1-4 arası sonuçları raporlayınız.
2 2ˆ ˆ ˆ6.73 0.08 0.705 2.82
ˆ( )(0.782)(0.02)
i i î
i
Y X u
Se
6. Ortalama fiyat esnekliğini hesaplayarak yorumlayınız.
35 , 3.83X Y ise 1
35ˆˆ ( 0.08) 0.733.83
X
Y
Fiyatlar %1 artarsa satışlar (talep) %0.73 azalacaktır.
7. Fiyatın 40 olduğu noktada fiyat esnekliğini hesaplayarak yorumlayınız.
Öncelikle 40X olduğu 40ˆXY hesaplanması gerekir.
40ˆ 6.73 0.08(40) 3.53XY
1
40
40 40ˆˆ 0.08 0.91ˆ 3.53X
X
Y
Fiyatın 40 olduğu noktada, fiyatlardaki %1 lik artış satışları %0.91 düşürür.
119
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde tahmin edilen parametrelerin güvenilirlik ölçüsü standart hatanın nasıl
hesaplandığı ve standart hatanın örnek verilerinden hesaplanan unsurlara göre nasıl değişiklik
göstereceği detaylı olarak verildi. Yine standart hataların hesaplanmasında bize gerekli olan
rassal hatanın varyansının tahmini verildi.
Bu bölümde iktisat derslerinizden bildiğiniz esneklik kavramının, ekonometrik bir
modelden nasıl hesaplandığını gördünüz.
120
Bölüm Soruları
Aşağıdaki 1-8 arası sorular için aşağıdaki verileri kullanarak cevaplandırınız.
Yıllar Y X
1991 1.3 6.2
1992 1.2 7.8
1993 1.4 5.8
1994 1.4 5.7
1995 1.5 5.0
1996 1.9 4.0
1997 2.6 3.2
1998 2.3 3.6
1999 2.5 3.3
2000 2.7 3.3
2001 2.1 5.6
2002 1.8 6.8
2003 2.2 5.6
1. Örnek regresyon fonksiyonunun ( 0 1ˆ ˆˆ
i iY X ) tahmini aşağıdakilerden
hangisidir?
a) ˆ 9.44 2.28i iY X
b) ˆ 1.09 2.28i iY X
c) ˆ 10.04 1.09i iY X
d) ˆ 6.32 0.96i iY X
e) ˆ 3.37 0.29i iY X
2. Kalıntı kareler toplamı aşağıdakilerden hangisidir.
a) 108.2
b) 65.1
c) 1.14
d) 3.44
e) 9.12
3. Ana kütle hata teriminin varyansını tahmini aşağıdakilerden hangisidir?
a) 0.104
b) 13.94
c) 0.806
d) 0.828
e) 0.653
4. 0 ve 1 ’in varyansları aşağıdakilerden hangisidir?
a) 0ˆ 0.986049Var , 1
ˆ 0.251001Var
121
b) 0ˆ 0.605409Var , 1
ˆ 3.97642Var
c) 0ˆ 0.109561Var , 1
ˆ 0.003969Var
d) 0ˆ 3.209782Var , 1
ˆ 6.083561Var
e) 0ˆ 3.218008Var , 1
ˆ 9.71387Var
5. 0 ve 1 ’in standart hataları aşağıdakilerden hangisidir?
a) 0ˆ 1.082Se , 1
ˆ 0.208Se
b) 0ˆ 0.331Se , 1
ˆ 0.501Se
c) 0ˆ 2.213Se , 1
ˆ 4.916Se
d) 0ˆ 0.331Se , 1
ˆ 0.063Se
e) 0ˆ 0.993Se , 1
ˆ 0.501Se
6. 0 ve 1 arasındaki ortak varyans aşağıdakilerden hangisidir?
a) 0.03961
b) 0.02006
c) -0.03961
d) 0.93071
e) -0.02006
7. Y’nin X’e göre ortalama esnekliği ve yorumu aşağıdakilerden hangisidir?
a) -0.77; X’deki %1’lik artış Y’de ortalama %0.77’lik azalışa neden olur.
b) -0.77; X’deki 1 birimlik artış Y’de ortalama %77’lik azalışa neden olur.
c) -0.77; X’deki %1’lik artış Y’de ortalama % 77’lik azalışa neden olur.
d) 0.77; X’deki %1’lik artış Y’de ortalama % 0.77’lik artışa neden olur.
e) 0.77; X’deki %1’lik artış Y’de ortalama % 77’lik artışa neden olur.
8. X=5.7 iken Y’nin X’e göre esnekliği ve yorumu aşağıdakilerden hangisidir?
a) -0.96 ; X=5.7 noktasında X’deki %1’lik artış Y’de % 96’lik azalışa neden olur.
b) 0.96 ; X=5.7 noktasında X’deki %1’lik artış Y’de % 0.96’lik artışa neden olur.
c) -0.96 ; X=5.7 noktasında X’deki 1birimlik artış Y’de 0.96 birimlik azalışa neden
olur.
d) 0.96 ; X=5.7 noktasında X’deki 1 birimlik artış Y’de % 0.96 birimlik azalışa
neden olur.
e) -0.96 ; X=5.7 noktasında X’deki %1’lik artış Y’de % 0.96’lik azalışa neden olur.
9. 0 ’ın varyansı için aşağıdaki ifadelerden hangisi yanlıştır.
a) Hata teriminin varyansı büyüdükçe, 0 ’ın varyansı da büyür.
b) X ‘lerin ortalamadan farklarının karesi büyüdükçe 0 ’ın varyansı küçülür.
c) Gözlem sayısı n büyüdükçe 0 ’ın varyansı küçülür.
122
d) ) Gözlemlenen X’ler, örnek regresyon doğrusuna yaklaştıkça 0 ’ın varyansı
küçülür.
e) Gözlemlenen X’lerin karelerinin toplamı büyüdükçe 0 ’ın varyansı büyür
10. Aşağıdaki ifadelerden hangisi yanlıştır.
a) Tahmin edilen parametrelerin varyansları örnekten örneğe değişir.
b) İki parametre tahmininden hangisinin daha varyansı daha küçük ise o parametre
daha güvenilirdir.
c) Tahmin edilen parametrelerin varyanslarını etkileyen unsurlardan biri hata teriminin
varyansıdır.
d) Nokta esnekliği her noktada değişir.
e) Basit regresyon modelinde hata teriminin varyansının tahmincisi 2 2ˆ 2ix n
dir.
Cevaplar
1) e
2) c
3) a
4) c
5) d
6) e
7) a
8) e
9) d
10) e
123
5. ARALIK TAHMİNİ VE HİPOTEZ TESTİ
124
Bu Bölümde Neler Öğreneceğiz?
5.1. Aralık Tahmini
5.1.1. Normal Dağılım ve t-Dağılımı
5.1.2. Aralık Tahminlerini Elde Etme
5.1.3. Açıklayıcı Uygulama: Satış Modeli
5.2. Hipotez Testleri
5.2.1. Temel Hipotez
5.2.2. Alternatif Hipotez
5.2.3. Test İstatistiği
5.2.4. Red Bölgesi
5.2.5. Karar
5.3. Hipotez Testi Örnekleri
5.3.1. Çift Kuyruk Testi
5.3.2. Çift Kuyruk Anlamlılık Testi
125
Bölüm Hakkında İlgi Oluşturan Sorular
1) Nokta tahminlerinden aralık tahminlerine geçebilir miyiz?
2) Verilen bir hipotezi nasıl test ederiz?
3) Hipotez testinin aşamaları nelerdir?
126
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Güven aralıklarının
oluşturulması ve
yorumlanması
Gerçek parametre değerinin
hangi aralıkta olabileceği
hakkında fikir sahibi olmak
İstatistik kitapları, Ders
notları ve uygulamaların
tekrarı,
Hipotez testlerinin aşamaları
ve uygulaması
Ana kütle hakkında çıkarım
yapabilmek
İstatistik kitapları, Ders
notları ve uygulamaların
tekrarı
127
Anahtar Kavramlar
Aralık Tahmini
Normal Dağılım
t-Dağılımı
Hipotez testi
Temel Hipotez
Alternatif Hipotez
Anlamlılık düzeyi
Kiritik (tablo değeri) Değer
Serbestlik dercesi
Test İstatistiği
128
Giriş
Bölüm 3'de basit doğrusal regresyon modelindeki parametrelerin nokta tahminlerini
elde etmek için en küçük kareler yaklaşımını kullandık. Bu nokta tahminleri, regresyon
fonksiyonu 0 1i iE Y X X ’daki iktisadi değişkenler arasındaki ilişkiyi tanımlayan bir
istatistiksel bilgi çıkarımı’dır. Bilgi çıkarma “bilinen veya varsayılan bir şeyden yola çıkarak
bir sonuca varma'' anlamındadır. Nokta tahminleri için iktisadi değişkenler arasında nedensellik
ilişki olduğu ve basit regresyon modeli ile ilgili 1-5 varsayımlarının geçerli olduğu varsayımları
yapılmıştır. Örnek regresyon fonksiyonunun tahmindeki amaç, bu varsayımlara dayanarak
örnek regresyon parametrelerinin ampirik tahminlerinden ( 0 1ˆ ˆ, ), verilerin elde edildiği ana
kütle hakkında bilgi çıkarımları yapmaktır.
Bu bölümde istatistiksel bilgi çıkarımının araçları aralık tahmini ve hipotez testi
tanıtılacaktır. (Hipotez testlerinden sadece çift kuyruk hipotez testleri ele alınacak olup tek
kuyruk hipotez testleri kapsam dışı bırakılmıştır.)
Hipotez testi ve aralık tahmini prosedürleri, basit doğrusal regresyon modelinin 6.
varsayımı “ hata terimleri normal dağılır” ve bunun bir sonucu olan EKK tahmincilerinin
normallik varsayımı ile yakinen ilgidir. Normallik varsayımı geçerli olmadığı durumda ancak
örneklem boyutu yeterince büyük ise EKK tahmincileri yaklaşık olarak normal dağılır.
Güven aralığı olarak da bilinen aralık tahmini, bilinmeyen parametrelerin içinde
bulunmasının olası olduğu bir değerler aralığı yaratma prosedürüdür.
Hipotez testi regresyon parametreleri ile ilgili varsayımı, bir veri örnekleminden elde
edilen parametre tahminleriyle karşılaştırma prosedürüdür. Hipotez testleri, verilerin belirli bir
varsayım veya hipotezle bağdaşıp bağdaşmadığı hakkında bilgi sağlar.
129
5.1. Aralık Tahmini
Bölüm 2 verilen uygulamada Örnek 1 verilerinden ( ˆ 17.29 0.61i iY X ) 1ˆ 0.61 ,
hane halkı harcanabilir gelir 100 lira arttığında, haftalık beklenen tüketim harcamasının artış
miktarıdır. Böylece haftalık gelir 100 lira arttığında, haftalık gıda harcaması ortalama 61 lira
artacağı tahmin edilmişti.
1ˆ 0.61 , regresyon modelindeki bilinmeyen ana kütle parametresinin (
1 ) bir nokta
tahminidir. Aralık tahmini, gerçek parametre 1 ’in bulunmasının olası olduğu bir değer aralığı
sunar. Bir değer aralığı sunmak, parametre değerinin ne olabileceği hakkında bir fikir ve ne
kadar kesinlikle tahmin ettiğimizi verir. Böyle aralıklar genellikle güven aralıkları adını alır.
5.1.1. Normal Dağılım ve t-Dağılımı
Basit doğrusal regresyon modeli için 1-6 varsayımlarının geçerli ise, en küçük kareler
tahmincileri 0 ve 1 normal dağılıma sahiptir.
0 ve 1 ’in en küçük kareler tahmincileri
0
ve 1 ’in normal dağılım parametreleri (ortalama ve varyansı) aşağıdaki gibidir.
2 2
0 0 2ˆ ,
i
i
XN
n x
2
1 1 2ˆ ,
i
Nx
1 için standardize edilmiş bir normal rassal değişken ise, 1 ’den ortalaması çıkarılıp
standart sapmasına bölünerek elde edilir:
1 1
2 2
ˆ0,1
i
Z Nx
Standardize edilmiş rassal değişken Z, 0 ortalama ve 1 varyansla normal dağılmıştır.
Normal dağılım tablosundan aşağıdaki eşitsizliği yazabileceğimizi biliyoruz. (Not: İstatistik
dersi konularından normal dağılımın özelliklerini ve normal dağılım tablosunu kullanmasını
hatırlayın, eksiğiniz varsa bu konuları İstatistik kitaplarından tekrar edin.)
1,96 1,96 0.95P Z
2 2
1 1ˆ
iZ x ‘ yi yukarıdaki eşitsizliğin içine yerleştirirsek,
1 1
2 2
ˆ1.96 1.96 0.95
i
Px
130
elde ederiz. Bu sonuç ana kütle parametresi 1 için yeniden düzenlenirse aşağıdaki ifadeyi
verir:
2 2
1 1 12 2ˆ ˆ1.96 1.96 0.95
i i
Px x
1 1 1 1 1ˆ ˆ ˆ ˆ1.96 ( ) 1.96 ( ) 0.95P SE SE
Bu, ana kütle 1 parametresini içerme olasılığı 0.95 olan bir aralığı tanımlar. Kısaca alt
ve üst sınırı 1 1ˆ ˆ1.96 ( )SE olan bir aralık tahmincisi sunar. Tekrarlanan örneklemede
yukarıdaki şekilde oluşturulan aralıkların %95 ‘i, 1 parametresinin gerçek değerini
içerecektir. Aralık tahmincisinin bu kolay türetimi hem 6. varsayıma yani hata terimlerinin
normal dağıldığına hem de hata terimi ( 2 ) varyansını biliyor olmamıza dayanmaktadır.
Ancak ana kütle hata terimi varyansının ( 2 ) değerini bilmediğimizi tahmin
edebileceğimizi daha önceki derslerimizden biliyoruz. En küçük kareler artıkları
0 1ˆ ˆˆ
i i i i iu Y Y Y X ve ana kütle hata terimi veryansının 2 tahmincisi
2 2ˆ ˆ 2iu n olduğunu da daha önceki derslerimizde gördük. Böylece 2 , 2 ile
değiştirerek çalışabileceğimiz bir rassal değişken elde ederiz ama bu yer değiştirme, olasılık
dağılımını standart normalden n-2 serbestlik dereceli bir 𝑡-dağılımına dönüştürür:
1 1 1 1 1 1
22 211
ˆ ˆ ˆ
ˆˆ ( )ˆ ( )n
i
t tSex Var
2 2
1 1ˆ ˆ
it x oranı (test istatistiği ile de adlandırılır.) 2nt t
ile gösterilen n-2
serbestlik dereceli bir t-dağılımına sahiptir. Benzer bir sonuç 0 için de geçerlidir, bu nedenle
basit doğrusal regresyon modelindeki 1-6 varsayımları gerçekleşiyorsa;
2
ˆ0,1 için
ˆ( )
i i
n
i
t t iSe
sonucunu çıkarabiliriz.
Bu eşitlik basit doğrusal regresyon modelindeki hipotez testi ve aralık tahmini için
temeli oluşturur.
t-dağılımı sıfırda ortalanmış çan-şeklinde bir eğridir. Daha büyük bir varyans ve daha
kalın kuyruklarla daha yayılmış olması dışında, standart normal dağılım gibi görünür, kısaca
normal dağılıma göre daha basık ve daha kalın kuyrukludur. t-dağılımının şekli, genellikle s.d.
şeklinde gösterilen ve serbestlik derecesi (n-k) adı verilen bir parametre tarafından kontrol
edilir. Burada n gözlem sayısını k parametre sayısını (basit regresyonda k=2) ifade eder. (n-
k)=m ise m serbestlik dereceli bir t-dağılımını belirtmek için ( )n kt veya mt gösterimleri
131
kullanılır1. Örneğin, (n-k)=m serbestlik derecesi için t-dağılımının 95'inci persentili 0.95,n kt
veya 0.95,mt şeklinde gösterilir. Olasılığın 0.95'i bu değerin soluna düşer, bu nedenle 𝑃[𝑡(𝑚) ≤
𝑡(0.95,𝑚)] = 0.95 . Örneğin, eğer serbestlik derecesi 𝑚 = 20 ise, t dağılım tablosundan,
𝑡(0.95,2) = 1.725 bulunur.
5.1.2 Aralık Tahminlerini Elde Etme
𝑡-dağılımından `kritik değer' 𝑡𝑐 bulabiliriz öyle ki 2c cP t t P t t ’dir ve
burada 𝛼 genellikle 𝛼 = 0.01 , 𝛼 = 0.0 5 ya da 𝛼 = 0.10 olarak alınan bir olasılıktır. Kritik
değer 𝑡𝑐 'nin 𝑛-k serbestlik derecesi için persentil değeri 2,n kt
. 𝑡𝑐 ve −𝑡𝑐 değerleri aşağıdaki
şekilde gösterilmektedir.
Şekil 5.1: Bir t-dağılımından kritik değerler
Taralı her ``kuyruk'' alanı olasılığın 2 kadarını taşır, bu nedenle olasılığın 1 − 𝛼
kadarı ortadaki kısımdadır. Sonuç olarak olasılık ifadesini aşağıdaki şekilde yazabiliriz:
𝑃(−𝑡𝑐 ≤ 𝑡 ≤ 𝑡𝑐) = 1 − 𝛼
%95 güven aralığı için kritik değerler 𝑡-dağılımının 1 − 𝛼 = 0.95 olasılığını taşıyan
merkezi bir bölge tanımlarlar. Bu, 𝛼 = 0.05 olasılığı iki kuyruk arasında eşit olarak bölerek
bırakır, böylece 𝛼/2 = 0.025 olur. Öyleyse kritik değer 𝑡𝑐 = 𝑡(1−0.025,𝑛−𝑘) = 𝑡(0.975,𝑛−𝑘) .
Basit regresyon modelinde serbestlik derecesi 𝑚 = 𝑛 − 2 'dir, böylece yukarıdaki ifade şu
şekle dönüşür:
𝑃[−𝑡(0.975,𝑛−2) ≤ 𝑡 ≤ 𝑡(0.975,𝑛−2)] = 0.95
Örneğin n=30 ise 𝑡(0.975,𝑛−2) =𝑡(0.975,28) persentil değerlerini t-. tablosundan 2.048
buluruz.
Şimdi tüm bu parçaları aralık tahmini prosedürü yaratmak için kullanacağız. Yukarıda
2 2
1 1ˆ ˆ
ix ile ifade edilen t, 𝑃(−𝑡𝑐 ≤ 𝑡 ≤ 𝑡𝑐) ‘ye yerleştirerek aşağıdaki ifade elde
edilir:
1 5. Haftanın sonunda Tablo …'de çeşitli serbestlik derecelerine sahip 𝑡 -dağılım persentil (kritik) değerleri
verilmiştir.
132
ˆ1
ˆ( )
i ic cP t t
Se
Bu ifadeyi yenideni için düzenleyerek aşağıdaki ifade elde edilir:
ˆ ˆ ˆ ˆ( ) ( ) 1i c i i i c iP t Se t Se
Aralığın alt ve üst değerleri ˆ ˆ( )i c it Se ve ˆ ˆ( )i c it Se örneklemden örnekleme
değişeceği için rassaldır. Bu uç noktalar i için bir aralık tahmincisi tanımlarlar. Yukarıdaki
olasılık ifadesi, bilinmeyen gerçek parametre i ’nin 1 − 𝛼 olasılığı ile ˆ ˆ( )i c it Se aralığının
içinde olduğu anlamına gelmektedir.
Olasılık ifadesindeki ˆi ve ˆ( )iSe , verilen örneklem verilerine dayanarak tahmin
edilen değerler (sayılar) olduğunda; ˆ ˆ( )i c it Se , i ’nin %100(1 − 𝛼) aralık tahmini
adını alır. Ynı zamanda %100(1 − 𝛼) bir güven aralığıdır. Geleneksel olarak 𝛼 = 0.01 , 𝛼 =
0.05 veya 𝛼 = 0.10 ‘dur. Bu nedenle %99 güven aralığı ,%95 güven aralığı veya %95
güven aralığı elde ederiz.
Güven aralıkların yorumlanması çok dikkat ister. Aralık tahmin prosedürlerinin
özellikleri tekrarlanan örnekleme kavramına dayanır. Eğer n boyutunda pek çok rassal
örneklem seçilir, her örneklem için en küçük kareler tahmini ˆi ve onun standart hatası ˆ( )iSe
’i hesaplanır ve sonra her örneklem için ˆ ˆ( )i c it Se aralık tahmini oluşturulur ise, oluşturulan
aralıkların %100(1 − 𝛼) kadarı gerçek parametre i içerir.
5.1.3. Açıklayıcı Uygulama: Satış Modeli
Satış gelirleri ve reklam harcamaları verilerinin kullanıldığı uygulamada n=5 ve
serbestlik derecesi n-k ‘dan 5-2=3 ‘dür. Bir %95 güven aralığı için 𝛼 = 0.05. Kritik değer
𝑡𝑐 = 𝑡(1−𝛼/2,𝑛−2) = 𝑡(0.0975,3) = 3.182 serbestlik derecesi 3 olan 𝑡 -dağılımından 97.5
persentildir. Böylece olasılık ifadesi 1 için aşağıdaki gibidir.
1 1 1 1 1ˆ ˆ ˆ ˆ( ) ( ) 1c cP t Se t Se
1 ‘in en küçük kareler tahmini 1
ˆ 1.2 ve onun standart hatası
1 1ˆ ˆ( ) ( ) 0.293 0.541Se Var
Kullanılarak 1 için olasılık ifadesi aşağıdaki gibi yazılır.
11.2 3.182 0.541 1.2 3.182 0.541 0.95P
Buradan 1 için bir ``%95 güven aralığı tahmini'' aşağıdaki gibidir.
133
1 1ˆ ˆ( ) 1.2 3.182 0.541 0.52 ; 2.92ct Se
Bir firmanın yıllık reklam harcamaları 1 birim artmasıyla satış gelirlerinin 0.52 ile
2.92 arasında bir değişiklik göstereceğini %95 güvenle tahmin ediyoruz.
Peki, 1 gerçekten de 0.52 ; 2.92 aralığında mı? Bu sorunun cevabını bilmiyoruz ve
hiçbir zaman da bilemeyeceğiz. Bildiğimiz ise; kullandığımız prosedür aynı anakütleden alınan
pek çok rassal örnekleme uygulandığında bu prosedür kullanılarak oluşturulmuş aralık
tahminlerinin %95'i gerçek parametreyi içerecektir.
1 'nin aralık tahmininin yararı nedir? Regresyon sonuçlarını rapor ederken her zaman
bir nokta tahmini veririz, mesela 1ˆ 1.2 gibi. Ancak tek başına nokta tahmini güvenilirliği
açısından hiçbir anlam taşımaz. Dolayısıyla bir aralık tahmini de sunabiliriz. Aralık tahminleri
hem nokta tahminini hem de en küçük kareler tahmincisinin değişkenliğinin bir ölçümü olan
tahminin standart hatasını hesaba katar. Aralık tahmini örneklem boyutu için de bir tahsis içerir
çünkü daha düşük serbestlik dereceleri için 𝑡-dağılımı kritik değeri 𝑡𝑐 daha büyüktür. Bir aralık
tahmini genişse (büyük bir standart hatayı getirir), örneklemde 1 hakkında çok fazla bilgi
olmadığı anlamına gelir. Eğer aralık tahmini darsa1 hakkında daha fazla şey öğrendiğimizi
gösterir.
0 için aralık tahmini yapmak istersek, 0 ‘in en küçük kareler tahmini 0
ˆ 1 ve onun
standart hatası
0 0ˆ ˆ( ) ( ) 3.223 1.795Se Var
kullanılarak 0 için olasılık ifadesi aşağıdaki gibi yazılır.
0 0 0 0 0ˆ ˆ ˆ ˆ( ) ( ) 1c cP t Se t Se
01 3.182 1.795 1 3.182 1.795 0.95P
Buradan 0 için bir ``%95 güven aralığı tahmini'' aşağıdaki gibidir.
0 0ˆ ˆ( ) 1 3.182 1.795 4.71;6.71ct Se
Bir firmanın yıllık reklam harcamalarının dışındaki unsurların satış gelirlerinde 4.71
ile 6.71arasında bir değişiklik göstereceğine %95 güvenle tahmin ediyoruz.
5.2 Hipotez Testleri
Hipotez testi; bir anakütle ile ilgili olarak sahip olduğumuz varsayımı, bir veri
örneklemindeki bilgiyle karşılaştırır. Bir ekonomik ve istatistiksel model verili iken, hipotezler
ekonomik davranışlar hakkında kurulur. Bu hipotezler daha sonra model parametreler hakkında
ifadeler olarak sunulur. Hipotez testleri, hipotez hakkında bir sonuca varmak için bir parametre
hakkında bir veri örnekleminde bulunan bilgiyi, onun en küçük kareler tahminini ve standart
hatasını kullanır.
134
Hipotez testinin 5 bileşeni vardır. Bunlar
1. Temel Hipotez H0
2. Alternatif Hipotez H1
3. Test İstatistiği
4. Red Bölgesi
5. Sonuç
5.2.1 Temel Hipotez
0H ile gösterilen temel hipotez, genellikle i , (i=0 veya i=1) olarak gösterdiğimiz ana
kütle regresyon parametresi için bir değer belirler. Temel hipotez 0 : iH c şeklinde yazılır
ve c sıfır veya sıfırdan farklı sabit bir sayıdır.
Bir temel hipotez örneklem kanıtı tarafından doğru olmadığı kanıtlanana kadar
sürdürülen iddaa ’dır. Doğru olmadığı kanıtlandığı takdirde temel hipotezi reddedilir.
5.2.2 Alternatif Hipotez
Her temel hipotez, temel hipotez (0H ) reddedildiğinde kabul edilebilecek alternatif bir
hipotez 1H ile eşleştirilir. Genellikle iktisat teorisine dayanan alternatif hipotez esnektir.
0 : iH c temel hipotezi için olası üç alternatif hipotez aşağıdaki gibidir:
1 1 1: : :i i iH c H c H c
Eşitsizlik alternatif hipotezleri ekonomide yaygın olarak kullanılır, çünkü ekonomik
teori değişkenler arasındaki ilişkinin işareti hakkında sıkça bilgi sağlar. Örneğin, tüketim
harcaması örneğinde 1 1: 0H alternatifine karşı
0 1: 0H temel hipotezini de test etmek
edilir, çünkü iktisat teorisine göre 1 marjinal tüketim meylidir. 10 1 arasında yer
alacağı, negatif değer alamayacağı için alternatif hipotezin 1 0 olması gerekir.
Biz sizlerle Ekonometri dersinde sadece çift taraflı hipotez testlerini ele alacak, tek
taraflı hipotez testlerini kapasam dışı tutacağız.
5.2.3 Test İstatistiği
Temel hipotez hakkındaki örneklem bilgisi, bir test istatistiğinin örneklem değerinde
yer alır.
Test istatistiğinin değerine dayanarak temel hipotezi reddedip reddetmeyeceğimize
karar veririz.
135
Temel hipotez doğru iken, olasılık dağılımının bilinmesi gerekir. Eğer temel hipotez
0 : iH c doğruysa ˆ ˆ( )i i it Se ’de i yerine 𝑐 ' yi koyabilir ve aşağıdaki ifade
yazılabilir:
2
ˆ
ˆ( )
i i
n
i
t tSe
Eğer temel hipotez doğru değilse yukarıdaki 𝑡 -istatistiği n-2 serbestlik dereceli 𝑡 -
dağılımına sahip değildir.
5.2.4. Red Bölgesi
Red bölgesi, olası olmayan ve temel hipotez doğru iken düşük gerçekleşme olasılığına
sahip değerleri içerir. Red bölgesi alternatif hipotezin nasıl kurulduğuna bağlıdır. Temel
hipotezin reddine yol açan test istatistiğinin değerler aralığı red bölgesini oluşturur. Red
bölgesinin oluşturabilmesi, temel hipotez doğru iken dağılımı bilinen bir test istatistiği,
alternatif hipotez ve anlamlılık düzeyinin bilinmesi gerekir.
Eğer temel hipotez doğru iken reddedilirse, Birinci Tip hata yapılmış olur. Bir testin
anlamlılık düzeyi Birinci Tip hata yapma olasılığıdır. Testin anlamlılık düzeyi 𝛼 genellikle
0.01, 0.05, 0.10 olarak seçilir. Eğer yanlış olan bir temel hipotezi reddedilmezse İkinci Tip hata
yapılmış olur.
5.2.5. Karar
Bir hipotezi test etmeyi bitirdiğinizde sonucunuzu ortaya koymalıyız. Ancak temel
hipotezin ``kabul edildiği'' sonucunu yanıltıcı olabilir, alternatif hipotez reddedilmiş ise “temel
hipotezin reddi için bir neden yoktur” sonucu daha gerçekçidir. Ayrıca sonucun, ekonomik
anlamında ne ifade ettiğini belirtmek gerekir.
5.3. Hipotez Testi Örnekleri
5.3.1. Çift Kuyruk Testi
0 1ˆ ˆˆ
i iY X tahmin edilen model için ana kütle parametresi 1 ‘in 0.55 ‘eşit olup
olmadığını test etmek isteyebiliriz. Buna göre1 0.55 ile gösterebilir, bunun doğru olup
olmadığını test etmek istiyorsak, 1 0.55 alternatiftir. Bu alternatif 1 ’in 0.55’den daha
büyük veya daha küçük olacağı iddiasında bulunmaz, sadece 0.55 olmadığını savunur. Bu tip
durumlarda çift kuyruk testini aşağıdaki gibi kullanırız:
1. Temel hipotez, alternatif hipotez
0 1: 0.55H
1 1: 0.55H
136
2. Eğer temel hipotez doğru ise test istatistiği aşağıdaki gibidir.
1 1 1
2
1 1
ˆ ˆ 0.55
ˆ ˆ( ) ( )n
t tSe Se
3. 𝛼 = 0.05 olarak seçelim. Bu çift kuyruk testi için kritik değerler 2.5-persentil
𝑡(0.025,8) = −2.306 ve 97.5 persentil 𝑡(0.975,8) = 2.306. Dolayısıyla eğer 𝑡'nin
hesaplanan değeri 𝑡 ≥ 2.306 veya 𝑡 ≤ −2.306 ise temel hipotezi reddedeceğiz.
Eğer −2.306 < 𝑡 < 2.306 ise temel hipotezi reddetmeyeceğiz.
Şekil. 5. 2. 0 1:H c hipotezinin
1 1:H c hipotezine karşı bir testinin red
bölgesi .
4. Tüketim harcaması verileri için, 1ˆ 0.61 ve standart hatası 1
ˆ( ) 0.05Se ’dır.
Test istatistiğinin değeri aşağıda verilmiştir:
1 1
1
ˆ 0.61 0.55 0.061.2
ˆ 0.05 0.05( )t
Se
5. −2.206 < 𝑡 = 1.2 < 2.206 olduğu için 1 0.55 temel hipotezini reddetmeyiz.
Burada dikkat edilmesi gereken nokta, bu test sonucuna göre 1 0.55 olduğu
sonucuna ulaşılmaz, sadece verilerin bu parametre değeriyle bağdaşıyor olmadığını söylüyoruz.
Çok önemli bir husus, hipotez testinin temel hipotezin doğru olduğunu kanıtlamak için
kullanılamayacağıdır.
137
Eğer 0 1:H c temel hipotezi
1 1:H c hipotezine karşı test ediliyorsa, , 𝑡𝑐 =
𝑡(1−𝛼/2,𝑁−2) ’den
ˆ ˆ ˆ ˆ( ) ( )i c i i c it Se c t Se
güven aralıkları oluşturulur. Verilen anlamlılık düzeyi 𝛼'da 𝑐 güven aralığı içerisinde ise, temel
hipotez reddedilmez. Eğer 𝑐 güven aralığı dışında ise temel hipotez reddedilir. Bu kural sadece
çift kuyruk testleri için geçerlidir.
5.3.2. Çift Kuyruklu Anlamlılık Testi
Hipotez testinin amacı değişkenler arasında bir ilişkinin olup olmadığını belirlemek ise
0 1ˆ ˆˆ
i iY X tahmin edilen model için temel hipotez 1 0 ’dır, diğer bir ifade ile, bağımlı
değişken ile bağımsız değişken arasında hiçbir doğrusal ilişki olmadığıdır. 1 0 olan
alternatif bir ilişkinin var olduğu anlamına gelir ama değişkenler arasındaki ilişki pozitif de
olabilir negatif de olabilir. Bu, bir anlamlılık testinin en yaygın şeklidir. Testin adımları
aşağıdaki gibidir:
6. Temel hipotez, alternatif hipotez
0 1: 0H
1 1: 0H
.
7. Eğer temel hipotez doğru ise test istatistiği aşağıdaki gibidir.
1 1
1
ˆ
ˆ( )t
Se
Ancak temel hipotez 1 0 şeklinde verildiği için diğer bir ifade ile anlamlılık
sınaması yapıldığı için test istatistiğinde yer olan 1 sıfıra eşit olduğu için test
istatistiği sadeleşerek aşağıdaki biçimde yazılır.
1
2
1
ˆ
ˆ( )n
t tSe
8. 𝛼 = 0.05 olarak seçelim. Çift kuyruk test için kritik değerler 2.5-persentil
𝑡(0.025,8) = −2.306 ve 97.5-persentil 𝑡(0.975,8) = 2.306′dır Eğer 𝑡 'nin hesaplanan
değeri 𝑡 ≥ 2.306 veya 𝑡 ≤ 2.306 ise temel hipotezi reddedeceğiz. Eğer −2.306 <
𝑡 < 2.306 ise temel hipotezi reddetmeyeceğiz.
9. 1ˆ 0.61 ve standart hatası da 1
ˆ( ) 0.05Se ise, test istatistiğinin değeri aşağıda
verilmiştir:
1
1
ˆ 0.61 0.6112.2
ˆ 0.05 0.05( )t
Se
138
10. 𝑡 = 12.2 > 2.024 olduğu için 1 0 temel hipotezini reddederiz ve bağımlı
değişken ile bağımsız değişken arasında istatistiksel olarak anlamlı bir ilişki olduğu
sonucuna varırız. Başka bir açıdan test istatistiği (-2.306 ; 2,306) aralığının dışında
kaldığı için temel hipotez reddedilir.
Önemli not: İstatistik olarak anlamlı ifadesi her zaman iktisadi açıdan anlamlı olduğu
anlamına gelmez.
139
Uygulamalar
140
Uygulama Soruları
1. Tahmin edilen bir basit regresyon modelinde, 24 gözleme dayanarak, tahmin edilen
eğim parametresi 0.310 ve tahmin edilen standart hata 0.082'dir.
Buna göre aşağıdaki 1-5 arası soruları cevaplandırınız.
a) Eğimin sıfır olduğu hipotezini sıfır olmadığı alternatifine karşı %1 anlamlılık
düzeyinde test edin.
Temel hipotez, alternatif hipotez
0 1
1 1
: 0
: 0
H
H
𝛼 = 0.01 olduğuna göre çift kuyruk test için kritik değerler 2.5-persentil
𝑡(0.025,22) = −2.819 ve 97.5-persentil 𝑡(0.975,22) = 2.819′dır. Eğer 𝑡 'nin hesaplanan değeri
𝑡 ≥ 2.819 veya 𝑡 ≤ 2.819 ise temel hipotezi reddedeceğiz. Eğer −2.819 < 𝑡 < 2.819 ise
temel hipotezi reddetmeyeceğiz.
Test istatistiğinin hesaplanan değeri;
1
1
ˆ 0.3103.78
ˆ 0.082( )t
Se
3.78 2.819t t için 0H hipotezi reddedilir, eğim parametresi istatistiksel açıdan
anlamlıdır. İlgili değişken modelde yer almalıdır.
b) Tahmin edilen eğim parametresinin 0.5 olduğu hipotezini 0.5 olmadığı
alternatifine karşı %5 anlamlılık düzeyinde test edin.
Temel hipotez, alternatif hipotez
0 1
1 1
: 0.5
: 0.5
H
H
Red bölgesi 2.074t veya 2.074t ’dir. Hesaplanan test istatistiğin değeri
1 1
1
ˆ 0.310 0.052.32
ˆ 0.082( )t
Se
141
2.32 2.074t olduğu için temel hipotez 0H reddedilir.
c) Eğim Parametresinin bir %99 aralık tahminini elde edin.
1 1ˆ ˆ( ) 0.310 2.819(0.082) (0.079;0.541)ct Se
2. Aşağıda tahmin edilmiş modelde
4,20 (**)
ˆ( ) (*) (0,002)
(2.016) (4.817)
i
i
Y X
Se
t
a) (*) yerine hangi değer gelmelidir?
00
0 0
2.08ˆ 4.20 ˆ2.016 ( )ˆ ˆ)
3( (
33)
3t SeSe Se
b) (**) yerine hangi değer gelmelidir?
1 11
1
ˆ ˆˆ4.81 0.07
ˆ 0.002( )09634t
Se
142
Bu Bölümde Ne Öğrendik Özeti
Klasik doğrusal regresyon modelinin ilk altı varsayımının geçerli olduğu altında ve
verilen bir anlamlılık düzeyinde ana kütle parametrelerinin aralık tahminlerinin nasıl
oluşturulduğu ve yorumlandığı ele alınmıştır.
Örnek regresyon denkleminden hareket ederek ana kütle hakkında çıkarsama yapmak
amacıyla kullanılan hipotez testinin bileşenleri ve hipotez testinin nasıl uygulandığı
açıklanmaya çalışılmıştır.
143
Bölüm Soruları
1. Aşağıda verilen modelde eğim katsayısının sıfır olduğu hipotezini sıfır olmadığı
alternatifine karşı %5 anlamlılık düzeyinde test edilirse, aşağıdaki şıklardan
hangisi yanlıştır.
104.02 0.69 20
ˆ (18.62) (0.07)i
Y X n
Se
a) 0 1 1 1: 0 , : 0H H
b) Red bölgesi 2.101t veya 2.101t
c) Test istatistiği 9.857143’ e eşittir.
d) Serbestlik derecesi 18’dir.
e) Temel hipotez kabul edilir.
2. Soru 1’deki eğim katsayısının güven aralıkları aşağıdakilerden hangisidir?
a) (0.54293;1.23293)
b) (1.27450;1.59012)
c) (-0.08529; 2.7256)
d) (0.03692; 1.62491)
e) (0.59310;1.542915)
3. Aşağıdaki boşluklara hangi değerler gelmelidir?
107.93 (**)
ˆ( ) (31.503) (19.72)
(*) (2.391)
i
i
Y X
Se
t
a) *=3400,119 ; **=47.15052
b) *=47.15052 ; **=8.247595
c) *=3.426023 ; **=47.15052
d) *=3.426023 ; **=8.247595
e) *=2.965108 ; **= 54.895301
4. Aşağıdakilerden hangisi hipotez testinin bileşeni değildir?
a) Temel Hipotez H0, Alternatif Hipotez H1
b) Güven aralığının oluşturulması
c) Test İstatistiği
d) Red Bölgesi
e) Sonuç
144
5. t-dağılımı normal dağılıma göre …….., varyanslı, …….. ve ………..kuyrukludur.
a) daha büyük ; basık ; kalın
b) daha küçük; basık; kalın
c) daha büyük ; sivri; kalın
d) daha küçük ; sivri; ince
e) daha küçük ; basık; ince
6. Aşağıda sonuçları raporlanmış regresyon modelinde eğim parametresinin 0.05
anlamlılık seviyesinde güven aralığı ve tablo değeri aşağıdakilerde hangisidir?
2ˆ ˆ20.858 1.942 17 3.96
ˆ (3.05) (0.026)
t t
i
Y X n
Se
,
a)
(0.975;15) 1 (0.975;15)
(0.975;15)
1.942 0.026 1.942 0.026 1
2.131
P t t
t
b) (0.95;17) 1 (0.95;7)
(0.95;17)
1.942 0.026 1.942 0.026 1
1.740
P t t
t
c)
(0.975;15) 1 (0.975;15)
(0.975;15)
ˆ1.942 0.026 1.942 0.026 1
2.131
P t t
t
d) (0.975;17) 1 (0.975;17)
(0.975;17)
ˆ1.942 0.026 1.942 0.026 1
2.110
P t t
t
e) (0.975;17) 1 (0.975;17)
(0.975;17)
1.942 0.026 1.942 0.026 1
2.110
P t t
t
7. Temel hipotez doğru iken reddedilirse ……. yapılmış olur, bir testin …………
birinci tip hata yapma olasılığıdır.
a) ikinci tip hata; anlamlılık düzeyi
b) birinci tip hata; anlamlılık düzeyi
c) birinci tip hata; 1
d) ikinci tip hata ; 1
e) ikinci tip hata, güven aralığı
145
8. Aşağıdakilerden hangisi yanlıştır?
a) Temel ve alternatif hipotezlerde ana kütle parametresi yer alır.
b) Gelenek anlamlılık düzeyleri 0.01 , 0.05 ve 0.10’dur.
c) Çift taraflı hipotez testlerinde alternatif hipotez anakütle parametresinin sıfır veya
sıfırdan farklı bir sayıya eşit olmadığı şeklinde kurulabilir.
d) Anlamlılık testi sonucunda temel hipotez kabul edilirse ilgili değişken bağımlı
değişkeni etkilemediği sonucuna varılır.
e) Hipotez testleri sadece çift taraflı kurulur.
9. Aşağıdaki boşlukları doldurunuz.
* (0.15)
ˆ( ) (1.08) (0,002)
(2.016) (**)
i
i
Y X
Se
t
a) 1.87 ; 75
b) 2.18 ; 75
c) 0.54 ; 37.5
d) 2.18 ; 37.5
e) 0.54 ; 75
10. Aşağıdaki ifadelerden hangisi yanlıştır?
a) t- dağılımının normal dağılımdan farklı olarak serbestlik derecelidir.
b) Ana kütle hata terimi bilinmiyor ancak tahmin ediliyorsa hipotez testi için t- dağılımı
kullanılır.
c) Ana kütle hata terimi bilinmiyor ancak tahmin ediliyorsa aralık tahmini için t- dağılımı
kullanılır.
d) Aralık tahmini için nokta tahmini ve nokta tahmininin standart hatasının bilinmesi
gerekir.
e) Geleneksek anlanlılık düzeyleri (0.01, 0.05, 0.10) ikinci tip hata yapma olasılığını
gösterir.
Cevaplar
1) e
2) a
3) c
4) b
146
5) a
6) a
7)b
8) e
9) b
10) e
147
6. UYUMUN İYİLİĞİ
148
Bu Bölümde Neler Öğreneceğiz?
6.1. Uyumun İyiliğinin Ölçülmesi ve Önemi
6.2. Belirginlik Katsayısı
6.3. Tahminin Standart Hatası
6.4. Genelleştirilmiş 2r
149
Bölüm Hakkında İlgi Oluşturan Sorular
1) Uyumun iyiliğinden ne anlıyoruz?
2) Tahmin edilen örnek regresyon doğrusunun verilere uygunluğu hakkında bilgi
veren ölçü var mıdır?
3) Uyumun iyiliği gösteren ölçülerden hangisini kullanmak daha uygundur? Neden?
150
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Uyumun İyiliği Tahmin edilen regresyon
denkleminin uygunluğu için
kriterlerin neler olduğu ve
hangisinin ne sebeple tercih
edildiği
Ders notları ve uygulamalar
Toplam Değişme,
Regresyona Bağlı Kareler
Toplamı, Hataya Bağlı
Kareler Toplamı
Toplam değişme, regresyon
ile açıklanan değişme ve
regresyonla açıklanamayan
değişmenin anlamını ve
onların belirginlik katsayısı
ile nasıl ilişkili olduğunu
açıklayabilmelisiniz.
Ders notları, alıştırmaları
yeniden çözülmeli ve
mümkün olduğunca farklı
örnekler ile çalışılmalı.
Belirginlik katsayısı ve
korelasyon katsayısı
Belirginlik katsayısından
korelasyon katsayısına ve
belirsizlik katsayısına
geçebilmelisiniz.
Ders notları ve uygulamalar
Tahminin Standart Hatası Regresyon doğrusunun
verilere uygunluğunu tespit
etmek
Ders notları ve uygulamalar
151
Anahtar Kavramlar
Uyumun iyiliği
Belirginlik katsayısı
Tahminin standart hatası
Belirsizlik katsayısı
Toplam değişme
Regresyona bağlı kareler toplamı
Hataya bağlı kareler toplamı
152
Giriş
Derslerimiz ilerledikçe tahmin ettiğimiz parametreler ve regresyon modeli ile ilgili
istatistiksel büyüklüklere de ulaşıyoruz. Bu dersimize kadar bunlardan hata teriminin
varyansının, tahmin edilen parametrelerin varyanslarını ve dolayısıyla bunların karekökü olan
standart hatalarını elde ettik. Bu doğrultuda ana kütle parametreleri için aralık tahminleri
oluşturduk ve hipotez testleri uyguladık.
Bu dersimizde regresyon doğrusu uyumunun üzerinde duracağız. Regresyon doğrusu
uyumundan ne anlıyoruz? Bilindiği üzere örnek regresyon doğrusu bağımlı değişkenin tahmini
değerlerinden geçer. Peki, bu tahmin edilen değerlerin gözlemlenen değerlere göre konumu
nedir? Bağımlı değişkenin tahmin edilen değerlerinden geçen regresyon doğrusu bağımlı
değişkenin gözlemlenen (teorik) değerler ne kadar yakınsa o derece uyumludur.
Bu dersimizde regresyon doğrusunun verilere uyumunu veren ölçülerin neler olduğunu,
hangisinin niçin tercih edildiği üzerinde duracağız.
153
6.1. Uyumun İyiliğinin Ölçülmesi ve Önemi
Örneklem verileri kullanılarak tahmin edilen regresyon modelinin belirlediği regresyon
doğrusu, serpilme diyagramında gözlemlenen değerlerin arasından geçmektedir. Tahmin edilen
modelin başarısı açısından regresyon doğrusunun verilere ne kadar yakın olduğu önemlidir. Bu
bölümde regresyon doğrusunun veriler uyumunun bir ölçüsü olan belirginlik katsayısı,
tahminin standart hatası ve genelleştirilmiş r2 tanıtılacaktır.
6.2. Belirginlik katsayısı
1.Bölümden bilindiği üzere regresyon modelindeki (0 1i i iY X u ) bağımsız
değişken Xi , “açıklayıcı değişken” olarak da adlandırılmaktadır. Bunun nedeni ise Yi’deki
değişimin, Xi’deki değişim ile “açıklanacağı” varsayılmakta, tahmin problemine bağlı olarak
bağımlı değişken 𝑌𝑖’deki değişimin mümkün olduğunca büyük bir kısmını 𝑋𝑖 ’in açıklaması
arzu edilmektedir.
Yi ’deki açıklanan değişimin bir ölçümünü geliştirmek için, Yi “açıklanabilir” ve
“açıklanamayan” bileşenlerine ayrılabilir. Bağımlı değişkenin
i i iY E Y u
ile gösterimindeki birinci unsur 0 1( )i iE Y X , Yi’nin açıklanabilir “sistematik” bileşeni,
ikinci unsur iu ise Yi ‘nin açıklanamayan “rassal, sistematik olmayan” bileşenidir. Bu
parçaların her ikisini gözlemlenemezken, bilinmeyen parametreler 0 ve 1 ’yi örnek
verilerinden tahmin ederek , Yi ’nin değerini benzer şekilde aşağıdaki gibi ayrıştırabiliriz.
ˆ ˆi i iY Y u
burada önceki derslerimizden 0 1ˆ ˆˆ
i iY X ve ˆˆi i iu Y Y eşitlikleri bilinmektedir.
Yi ’yi yukarıdaki gibi bileşenlerine ayrılabilmesi, EKK özelliklerinden örnek regresyon
doğrusunun “ortalamalar noktası” ,X Y noktasından geçtiği varsayımına dayanmaktadır. Buna
göre ˆ ˆi i iY Y u denklemini her iki tarafından örneklem ortalaması Y ’yi çıkartarak aşağıdaki
gibi yazmak mümkündür.
i. gözlem için;
ˆ ˆi i iY Y Y Y u
ˆ ˆi i iy y u
154
Şekil 6.1 ile gösterilen iY ile ortalama değeri Y arasındaki fark ( iY Y ; regresyon
modeli ile “açıklanan” ˆiY Y ve regresyonla açıklanamayan ( ˆ
iu ) olmak üzere iki parçadan
oluşmaktadır.
Şekil 6.1. Yi’nin açıklanan ve açıklanamayan bileşenleri
Böylece i. gözlem için iY ’deki örneklem değişim ˆ ˆ
i i iY Y Y Y u veya
ˆ ˆi i iy y u ile gösterilir. 1 2, , nY Y Y ‘e kadar bir örnekleme sahip isek, bu örneklemenin
örneklem ortalaması Y ve örneklem varyansı 22 1y iS Y Y n olmak üzere iki
tanımlayıcı ölçüsü olduğu istatistik derslerinden bilinmektedir. Bütün örneklem için aynı
değişimin hesaplanabilmesi için 1, ,i n ’e kadar örneklem değerleri iY ’ler ile örneklem
ortalaması Y arasındaki farkların kareli toplamı 2
iY Y alınır ki; bu kareli toplam
2
iY Y , örneklem değerlerindeki toplam değişimin bir ölçüsüdür. ( Not: İstatistik dersinde
verilen aritmetik ortalamanın özelliklerinden ( ) 0i iy Y Y olduğu bilinmektedir. Bu
nedenle iy ’lerin toplamı değil, karelerinin toplamı alınmaktadır. )
ˆ ˆi i iY Y Y Y u veya
ˆ ˆi i iy y u
Yyukarıdaki denklemin her iki tarafının karelerinin toplamı alınır
X
Y
ˆ ˆi iY Y y
,X YˆY Y
i iY Y y
0 1ˆ ˆY X
ˆ ˆi iY Y u
iX
X ,i iX Y
iY
0
155
2 2
2 2 2
2 2 2 2
1
2 2 2 2
1
ˆ ˆ( )
ˆ ˆ ˆ ˆ ˆ ˆ2 0 olduğundan
ˆˆ ˆ ˆ 'den
ˆ ˆ
i i i
i i i i i i i
i i i i i
i i i
y y u
y y u y u y u
y y u y x
y x u
sonucuna ulaşılır. Burada;
2 2( )i iy Y Y = Toplam değişme olarak da adlandırılan Bütün Kareler Toplamı
(BKT)’dır. Örneklem ortalaması etrafında 𝑌’deki toplam değişimin bir ölçümüdür.
2 2 2 2
1ˆˆˆ ( )i i iy Y Y x = Regresyona bağlı Kareler Toplamı (RKT)’dır. Aynı zamanda
“regresyonla açıklanan kareler toplamı” olarak da bilinmektedir.
2 2ˆˆ ( )i iu Y Y = Hataya bağlı Kareler Toplamı (HKT)’dır. Aynı zamanda
“açıklanamayan kareler toplamı”, “kalıntı karelerinin toplamı” veya “kareli hataların toplamı”
olarak bilinmektedir
Verilen kısaltmalar kullanılarak yukarıdaki eşitlik kısaca
BKT=RKT+HKT
ile de gösterilmektedir.
Y’deki toplam değişimin, regresyon modeli ile açıklanan ve açıklanamayan olarak iki
parçaya ayrıştırılması, regresyon modeli içindeki X ile açıklanan değişmenin Y’deki değişime
oranı olan, belirleme katsayısı ( 2r -re-kare, çok değişkenli regresyonda 2R ) olarak bilinen bir
ölçümü tanımlamamıza izin verir. Şöyle ki;
2 2 2ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y
veya
2 2 2ˆ ˆ
i i iy y u
denklemlerinin her iki yanı toplam değişmeye (BKT) -2 2( )i iy Y Y - bölünürse
2 2
2 2
ˆ ˆ1
i i
i i
y u
y y
sonucuna ulaşılır. Regresyon ile açıklanabilen değişmenin toplam değişmeye oranı yukarıda da
belirtildiği üzere belirginlik katsayısına ( 2r ) eşittir.
2 2 2 2
12
2 2 2
ˆˆ ˆ( )
( )
i i i
i i i
Y Y y x RKTr
Y Y y y BKT
156
Belirginlik katsayısını Hata Kareler Toplamı (HKT) ile de göstermek mümkündür.
Bunun için
2
2
2
ˆ1
i
i
ur
y
‘den 2r aşağıdaki gibi yazılır.
2
2
2
ˆ1 1
i
i
u HKTr
y BKT
2r için yukarıda verilenlerden başka hesaplama yolları da önerilebilir. Bunun için
2 2 2 2
1ˆ
i ir x y eşitliğinin pay ve paydası n veya n-1’e bölündüğünde
2
2 2
1 2ˆ i
i
x nr
y n
elde edilir. Açıktır ki; 2
ix n terimi X bağımsız değişkeninin koşulsuz varyansına 2( )XS ,
2
iy n terimi ise Y bağımlı değişkeninin koşulsuz varyansına2( )YS eşittir. Nihayet
22 2
1 2ˆ X
Y
r
sonucuna ulaşılır.
Belirginlik katsayısı (r2), örnek regresyon doğrusunun verilere uygunluğunu gösteren
bir ölçüsüdür. Bu bağlamda belirginlik katsayısı, bağımlı değişkende meydana gelen
değişmenin yüzde kaçının bağımsız değişken ve/veya değişkenlerdeki değişim tarafından
açıklanabildiğini göstermektedir.
Belirginlik katsayısı 20 1r arasında yer almaktadır. 2r , 1’e ne kadar yakınsa
örneklem değerleri ( ˆiY ), iY değerleri ile o kadar uyumlu, dolayısıyla örnek regresyon denklemi
0 1ˆ ˆˆ
iY X ana kütle regresyon denklemine (0 1( )i iE Y X ) o nisbette yakın olacaktır.
2 1r ise, bağımlı değişkende meydana gelen toplam değişmenin tamamı (%100)
bağımsız değişken(ler)deki değişim ile açıklanmaktadır. Söz konusu durum “tam uyum” olarak
bilinmektedir. 2 0r olması ise, eğim parametresinin 1 =0 olması koşulana bağlıdır. Bu
durumda örnek regresyon fonksiyonu 0ˆˆ
iY , regresyon doğrusu ise X eksenine paralel yatay
bir doğru biçimindedir.
157
2r hangi değeri almalıdır? 2r ’yi bulma ve raporlama, değişimin farklı kaynaklarının
göreli büyüklükleri hakkında bilgi vermesine rağmen, belirli bir 2r ’nin “yeterince büyük” olup
olmadığı hakkındaki tartışmalar gereksizdir. Her ne kadar 2r nin 1’e yakın olması regresyon
doğrusunun verilere uygunluğu göstermekte ise de, zaman serisi verilerinin kullanıldığı
modellerde trendin etkisiyle yüksek 2r ’ye, yatay kesit verilerinin kullanıldığı modellerde ise
düşük 2r ’ye rastlamak mümkündür. Yatay-kesit verisi ile çalışılırsa 2r ’nin 0.10’dan 0.40’a
değerleri, çok değişkenli regresyon modelleri için bile kabul görür. Zaman boyunca çoğu kez
birlikte değişme eğilimi olan zaman-serisi verisi kullanan makroekonomik analizde 0.90 ve
daha yüksek bir 2r değerleri elde etmek mümkündür. Dolayısıyla regresyon doğrusunun
uygunluğu konusunda 2r ye göre yorum yaparken kullanılan veri türü dikkate alınmalıdır.
Dolayısıyla 2r bir istatistiktir test edilmesi gerekir. 2r ‘nin testi F-testidir ki; bu testi ilerleyen
derslerimizde öğreneceğiz. Böylece model sadece 2r ’ye göre değil, tahminlerin işaretleri ve
büyüklükleri, onların istatistiksel ve ekonomik anlamlılığı, tahminlerinin doğruluğu gibi
faktörleri dikkate alarak değerlendirilmelidir.
2r , X ve Y’ nin ölçü birimine tabi değildir. Bu özelliğiyle verilerin regresyon doğrusuna
uyumunu, gösteren aşağıda ele alınacak diğer ölçü birimlerinden tahminin standart hatasına
üstünlük sağlamaktadır.
Örnek kütle için 2r ile gösterilen belirginlik katsayı, ana kütle için
2
YX ile gösterilir.
Şimdi belirginlik katsayından belirsizlik katsayısına geçilecektir. Bunun için,
2
2
2
ˆi
i
yr
y
’den 2 2 2ˆ
i iy r y
Ve yine
2
2
2
ˆ1
i
i
ur
y
’den 2 2 2ˆ (1 )i iu r y
eşitlikleri yazılabilir. Böylece
2 2 2ˆ ˆ
i i iy y u
eşitliği, 2r ve toplam değişme açısından yeniden aşağıdaki gibi yazılır.
2 2 2 2 2(1 )i i iy r y r y
158
Buradaki 2(1 )r belirsizlik katsayısıdır ve toplam değişmenin ne kadarının
regresyonda yer almayan değişkenler tarafından açıklanabildiğini gösterir. 2r , 1’e yaklaştıkça,
21 r ise 0’a yaklaştıkça regresyon doğrusunun verilere uyumu artacaktır.
Basit doğrusal regresyon modelinde belirginlik katsayısı ( 2r ) ve basit korelasyon
katsayısı ( XYr ) arasında ilişki vardır. Örneklem veri değerleri Xi ile Yi arasındaki doğrusal
ilişkinin varlığını gösteren örneklem korelasyon katsayısının karesi 2
XYr , basit bir regresyon
modelinde 2r ’ye cebirsel olarak eşittir (2 2
XYr r ). Böylece basit regresyonda belirginlik
katsayısından korelasyon katsayısına geçilebilmektedir.
İSPAT
Belirginlik katsayısı denklemi
2 2
12
2
ˆi
i
xr
y
’da 1 yerine 1 2ˆ i i
i
x y
x
eşitliği yazılırsa
2
2 2
2
2
i i i i
i
x y x xr
y
elde edilir, sadeleştirme yapılırsa
2
2
2 2
i i
i i
x yr
x y
sonucuna ulaşılır ki; bu belirginlik katsayısıdır. Yukarıdaki denklemden anlaşılmaktadır ki,
basit regresyon modeli için hesaplanan belirginlik katsayısı ( 2r ) korelasyon katsayısının
karesine eşittir, dolayısıyla belirginlik katsayısının kare kökü basit korelasyon katsayısı verir. 2
XYr r
Burada üzerinde durulması gereken nokta belirginlik katsayısı 20 1r iken,
korelasyon katsayısı 1 1r değerleri arasında yer alır. Belirginlik katsayısından
korelasyon katsayısına geçerken değişken arasındaki ilişkinin yönünü gösteren korelasyon
katsayısı işaretini, regresyon modelindeki 1 ’nin işaretinden alır..
6.3. Tahmini Standart Hatası
Basit korrelasyon katsayı sıfır noktasından ve ölçekten bağımsızdır. Basit korelasyon katsayısı iki değişken
arasındaki doğrusal ilişkinin yönü ve derecesimin tespiti için kullanılır. r=0 ise iki değişken arasında ilişki olmadığı
anlamına gelmez, doğrusal ilişkinin olmadığına işarettir. Örneğin Y=X2 ilişkisinde r=0 dır. r’nin (-) veya (+) değer
alması iki değişken arasındaki örneklem ortak varyansının işaretine bağlıdır.
159
Regresyon doğrusunun verilere uygunluğunun ikinci bir ölçütü tahminin standart
hatasıdır. Örnek regresyonunun standart sapması olarak da adlandırılan tahminin standart
hatası, ana kütle hata terimi varyansı tahmininin ( 2 ) kareköküdür. Hata terimi varyansının
tahmini aynı zamanda regresyondan elde edilen bilginin bir ölçüsü olduğu için karekökü olan
tahminin standart hatası regresyonun verilere uyumunu gösterecektir. Tahminin standart hatası
aşağıdaki gibidir.
2 2ˆ ˆ( )
ˆ2 2
i i iY Y u
n n
Verilerin, regresyon doğrusu etrafındaki dağılmasının ölçüsü olan tahminin standart
hatasının ( ) büyüklüğü iY ile ˆ
iY arasındaki farkın büyüklüğüne bağlıdır. Bu farkın
2ˆ( )i iY Y küçük çıkması, ˆiY ’ lerin verilere (
iY ) lere yaklaştığı, böylece regresyon
doğrusunun verilere uyduğunu gösterecektir.
Ancak tahminin standart hatasının uyumun iyiliği için kullanılması, aşağıda belirtilen
nedenlerden dolayı sakıncalıdır.
- Tahminin standart hatası bağımlı değişkenin ölçü birimine bağlıdır. Bağımlı değişken
ton ile ölçülür ise tahminin standart hatası küçük, kg ile ölçülür ise tahminin standart hatası
büyük çıkacaktır.
- Tahminin standart hatası, belirginlik katsayında ( 20 1r ) olduğu gibi her durum için
geçerli kesin sınırları yoktur. Regresyon doğrusunun tam uyumu durumunda, diğer bir ifade ile
örnek regresyon doğrusunun iY değerlerinden geçtiği durumda,
iY ile ˆiY arasındaki fark sıfır
olacaktır. Dolayısıyla tahminin standart hatası için alt sınır sıfırdır. Diğer uç bir durum ise
uyumsuzlukta ise bir sınır getirilememektedir.
6.4. Genelleştirilmiş 2r
Örnek regresyon doğrusunun verilere uyumunun tespiti için bir diğer seçenek iY ’ler
ile tahmini değeri ˆiY ’ler arasındaki ilişkinin saptanmasıdır. Bir çok durumda
2
ˆYYr olarak da
gösterilen iY ve ˆiY arasındaki kareli basit korelasyon, uyum iyiliği için geçerli bir ölçüdür.
Burada Y ’nin bulabilecek “en iyi” öngörü olduğu varsayılır. “en iyi” öngörücü, üzerinde
düşünülen modele bağlı olarak değişebilir. Yani, genel bir uyum iyiliği ölçüsü veya genel 2r
2
2 2
ˆˆ( , )G YY
r cor Y Y r
veya daha açık bir gösterimle aşağıdaki gibidir.
160
2
2
2
ˆ 2 222
ˆ ˆ ˆ
ˆˆ ˆ
i i i i
YY
i i
i i
Y Y Y Y y yr
y yY Y Y Y
iY ile ˆiY arasındaki basit korelasyon katsayısı ˆ1 1
YYr değerleri arasında yer
alacağı için, bu ifadenin karesi genelleştirilmiş 2
ˆYYr , 0 ile 1 arasında değer alır,
2
ˆ0 1YYr .
Genelleştirilmiş 2
ˆYYr , uygunluk katsayısı olarak da bilinmektedir.
6.5. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları
Satış gelirleri (Y) ile reklam harcamaları(X) uygulamasında aşağıdaki veri ve ara sonuçlardan
Y X X2 XY ˆ
iY ˆˆi i iu Y Y 2ˆ
iu
3 1 1 3 2.2 0.8 (0.8)2
4 2 4 8 3.4 0.6 (0.6)2
2 3 9 6 4.6 -2.6 (-2.6)2
6 4 16 24 5.8 0.2 (0.2)2 8 5 25 40 7.0 1 (1)2
23i
Y
4.6Y
15i
X
3X
255
iX 81ii
Y X ˆ 23i
Y ˆ 0i
u 2ˆ 8.8iu
örnek regresyon denklemi ˆ 1.0 1.2i iY X olarak bulunmuştu.
Şimdi belirginlik katsayısı, belirsizlik katsayısı, korelasyon katsayısı ve tahminin standart
hatasını hesaplayalım. Bu uygulamada belirginlik katsayısı değişik yollardan hesaplanacaktır.
Bunlardan ilki
2
2
2
ˆ( )
( )
i
i
Y Yr
Y Y
formülünün kullanılmasıdır. Buna göre formülde yer alan unsurlardan 2ˆ( )iY Y ve
2( )iY Y değerlerinin hesaplanması gerekir.
iY ˆiY
iY - Y 2
iY Y ˆiY Y
2ˆiY Y
3 2.2 -1.6 2.56 -2.4 5.76
4 3.4 -0.6 0.36 -1.2 1.44 2 4.6 -2.6 6.76 0 0
6 5.8 1.4 1.96 1.2 1.44
8 7.0 3.4 11.56 2.4 5.76
23i
Y
4.6Y
ˆ 23i
Y 0iY Y
2
23.2iY Y
ˆ 0iY Y
2
ˆ 14.4iY Y
2
2
2
ˆ( ) 14.40.62
( ) 23.2
i
i
Y Yr
Y Y
Satışlardaki toplam değişimin % 62’si bağımsız değişken reklam harcamaları tarafından
açıklanmaktadır.
Belirginlik katsayısını yukarıdaki verileri kullanarak farklı bir formül ile hesaplayalım.
161
2 2
2
2 2
ˆ ˆ( ) 8.81 1 1 0.62
( ) 23.2
i i i
i i
Y Y ur
Y Y y
Sonucun aynı olduğunu görüyoruz. Bir başka şekilde nasıl hesaplayabilirdik?
2 2 2 2
12
2 2 2
ˆˆ ˆ( )
( )
i i i
i i i
Y Y y xr
Y Y y y
Denklemdeki toplam değişme 2
iy , yukarıda 23.2 değerine eşit hesaplanmıştır. 2
1 ‘yi
hesaplamak gayet kolay olup 2
1.2 ’dir. 2
ix , 1 tahmin edilirken 10 olarak hesaplanmıştı.
Buna göre
22 2
12
2
ˆ 1.2 10 14.40.62
23.2 23.2
i
i
xr
y
yine aynı sonuca ulaşılır.
Belirginlik katsayısından satışlar ile reklam harcamaları arasındaki basit korelasyon
katsayısını hesaplayabiliriz.
2 0.62 0.79XYr r
Örneklem korelasyon katsayısı işaretini 1ˆ 1.2 ’den almıştır. 1 ’in tahmini pozitif
işaretli olduğu için XYr da pozitif işaretlilidir. Bu sonuca göre satışlar ile reklam harcamaları
arasında aynı yönde (pozitif) güçlü (0.79) bir doğrusal ilişki vardır. Basit korrelasyon
katsayısını 2 2
i i i ir x y x y formülünden hesaplanarak aynı sonuca ulaşıldığını
göstermek okuyucuya bırakılmıştır.
Belirginlik katsayısından, belirsizlik katsayısı 21 r ’yi de hesaplamak mümkündür.
Belirsizlik katsayısı 21 1 0.62 0.38r ’dir. Bu sonuca göre satışlardaki toplam değişmenin
%38’i reklam harcamaları dışındaki değişkenler tarafından açıklanmaktadır.
Regresyon denkleminin uyumunu gösteren diğer bir ölçü tahminin standart hatasıdır.
Tahminin standart hatası: 2
1 değerine eşittir.
Bu örnek ile ilgili sonuçlar aşağıdaki gibi raporlanır.
2ˆ ˆ1.0 1.2 0.62 1.71 5
( )(1.795)(0.541)
i i
i
Y X r n
Se
162
Uygulamalar
Tüketim Harcamaları ile Gelir
Örneklem 1
Örneklem 1 için aşağıdaki ara sonuçlardan
n=10 1211Y 1700iX 2 322000iX 226020i iY X 170X 121.1Y
ˆ 17.29 0.61i iY X regresyon denklemini tahmin etmiştik. Şimdi modelin belirginlik katsayısı,
belirsizlik katsayısı, korelasyon katsayısı ve tahminin standart hatasını hesaplayacağız.
Belirginlik katsayısını farklı yollarla hesaplayabileceğimizi biliyoruz. Bunlardan birini
Örneklem 1 için, bir başkasını Örneklem 2 için kullanacağız. Örneklem 1 için aşağıdaki
formülü kullanıyoruz.
2 2 2
12
2 2
ˆˆiy x
ry y
Öncelikle regresyon ile açıklanan değişme (RKT )2y aşağıdaki eşitlikten hesaplamamız
gerekir.
2 2 2
1ˆˆ
iy x
Yukarıdaki eşitlikte yer alan 1 bilinmekte ancak X’deki değişme 2
ix bilinmemektedir.
Öncelikle ara sonuçlardan 2
ix ’nin hesaplanması gerekir.
2 2 2 2322000 10 170 33000i ix X nX
Buradan regresyon ile açıklanan değişme:
22 2 2
1ˆˆ 0.61 33000 12279.3iy x olarak hesaplanır.
Şimdi belirginlik katsayının ikinci bileşeni toplam değişmeyi (BKT) 2y hesaplayacağız.
Toplam değişme
2 2 2y Y nY
eşitliğinden hesaplanır. Ancak yukarıdaki ara sonuçlarda gözlemlenen Y’lerin karelerinin
toplamı (2
iY ) verilmediği için öncelikle 2
iY ’nın hesaplanması gerekir.
163
ÖRNEK 1
iY 2
iY
65 4225
80 6400
79 6241
113 12769
125 15625
115 13225
144 20736
157 24649
155 24025
178 31684
2 159579iY
2 159579iY hesaplandığına göre
22 2 2 159579 10 121.1 12926.9y Y nY
Buradan belirginlik katsayısı
2 2
12
2
ˆ 12279.30.95
12926.9
ixr
y
Bu sonuca göre tüketimdeki toplam değişmenin %95’ i gelir ile açıklanmaktadır. Belirsizlik
katsayısı; 21 1 0.95 0.05r
Tüketimdeki toplam değişmenin %5’i gelir dışındaki başka değişkenler ile açıklanmaktadır.
Gelir ile tüketim arasındaki basit korelasyon katsayısı:
2 0.95 0.97r r
Korelasyon katsayısı işaretini 1 ’in işaretinden almıştır. Gelir ile tüketim arasında aynı yönde
güçlü doğrusal bir ilişki vardır.
Regresyon doğrusunun verilere uyumunu gösteren diğer bir ölçü tahminin standart hatasını
hesaplayalım.
2ˆ
ˆ2
iu
n
Burada kalıntı kareler toplamını bilmiyoruz. Ancak
2 2 2ˆ
iy y u
164
eşitliğinden hesaplayabiliriz. Buna göre yukarıda hesapladığımız değerleri yerine koyarsak;
2ˆ12926.9 12279.3 iu
Buradan
2ˆ 12926.9 12279.3 647.6iu
olarak hesaplanır ve tahminin standart hatası aşağıdaki gibidir.
2ˆ 647.6
ˆ 80.95 8.9972 10 2
iu
n
Örneklem 1 için elde edilen sonuçlar aşağıdaki gibi raporlanır.
ˆ 17.29 0.61
( ) (8.72)(0.049)
i i
i
Y X
Se
2 0.95r ˆ 8.997 10n
Not: 2 2 2
12
2 2
ˆˆiy x
ry y
eşitliği aynı zamanda gözlemlenen değerler ile
2 2
2
2 2
ˆˆ ( )
( )
i
i
y Y Yr
y Y Y
ile gösterilmektedir. Satış örneğinde olduğu gibi 2
2
ˆ( )
( )
i
i
Y Y
Y Y
eşitliğini kullanarak belirginlik katsayısını sizler hesaplayın.
Örneklem 2.
Örneklem 2 için aşağıdaki ara sonuçlardan
n=10 1207Y 1700iX 2 322000iX 226800i iY X 170X 120.7Y
ˆ 9.37 0.65i iY X regresyon denklemi tahmin edilmişti. Örneklem 2 için tahmin edilen
modelin belirginlik katsayısı, belirsizlik katsayısı, korelasyon katsayısı ve tahminin standart
hatasını hesaplayacağız. Örneklem 2 için aşağıdaki formülü kullanıyoruz. 2
2
2
ˆ1
i
i
ur
y
Yine burada toplam değişme 2
iy ve regresyonla açıklanamayan değişme hata kareleri
toplamı (2
iu ) bilinmemektedir. Öncelikle toplam değişmeyi (2
iy ) hesaplayalım.
2 2 2y Y nY
165
ÖRNEK 2
iY 2
iY
55 3025
74 5476
90 8100
103 10609
107 11449
135 18225
144 20736
160 25600
189 35721
150 22500
2 161441iY
22 2 2 161441 10 120.7 15756.1y Y nY
Formülde diğer bilinmeyen kalıntı kareler toplamı2
iu ’dır. Ancak 2
iu aşağıdaki eşitlikten
hesaplanabilmesi için regresyonla açıklanan değişmenin 2y hesaplanması gerekir.
2 2 2ˆ
iy y u
Regresyonla açıklanan değişme ise aşağıdaki gibidir.
2 2 2
1ˆˆ
iy x
Ancak burada da X deki değişmenin yukarıda verilen verilerden hesaplanması gerekecektir.
2 2 2 2322000 10 170 33000i ix X nX
Önemli not: Her iki örneklemde de X’ler sabit olduğu için X’dki değişmenin aynı olduğuna
dikkat edin.
Buradan hesaplamaları yapabiliriz. Regresyonla açıklanabilen değişme aşağıda hesaplanmıştır.
22 2 2
1ˆˆ 0.65 33000 13942.5iy x
Toplam değişmenin bileşenlerinden regresyon ile açıklanamayan değişmeyi bulabiliriz.
2 2 2ˆ
iy y u
215756.1 139 ˆ42.5 iu
2 15756.1 13942.5ˆ 1813.6iu
Şimdi belirginlik katsayısını hesaplayabiliriz.
166
2
2
2
1813.ˆ1 1
6
15756.8
.10 8
i
i
ur
y
Böylece tüketimdeki toplam değişmenin %88’ gelir değişkeni ile açıklanmaktadır. Belirsizlik
katsayısı; 21 1 0.88 0.12r
Tüketimdeki toplam değişmenin %12’si gelir dışındaki modele girmeyen değişkenler ile
açıklanmaktadır. Gelir ile tüketim arasındaki basit korelasyon katsayısı
2 0.88 0.94r r
Gelir ile tüketim arasında aynı yönlü güçlü doğrusal bir ilişki vardır. Tahminin stadart hatası:
2
1813.6ˆˆ 226.7 15.057
2 10 2
iu
n
olarak hesaplanır.
Not: 2 2
2
2 2
ˆ ˆ( )1 1
( )
i i i
i i
Y Y ur
Y Y y
eşitliği bilindiğine göre, gözlemlenen verilerden elde
ettiğiniz sonuçları 2
2
2
ˆ( )1
( )
i i
i
Y Yr
Y Y
denkleminde yerine koyar ve hesaplamaları yaparsanız
aynı sonuca ulaşırsınız. Lütfen bu uygulamayı sizler yapın.
Örneklem 2 için elde edilen sonuçlar aşağıdaki gibi raporlanır.
ˆ 9.37 0.65
( ) (14.02)(0.08)
i i
i
Y X
Se
2 0.88r ˆ 15.057 10n
Yukarıda aynı ana kütleden çekilen iki örneklemden siz olsanız hangisi tercih edersiniz?
Hiç kuşkusuz cevabınız 1. Örneklem olmalı. Çünkü belirginlik katsayı ve korelasyon katsayısı
2. Örnekleme göre daha büyük, belirsizlik katsayısı ve tahminin standart hatası ise daha
küçüktür.
167
Uygulama Soruları
15 yıllık verilerden İthalatın Gayrisafi Yurtiçi Hasıla ile açıklandığı modelde ˆİTH
=ithalat, GSYİH = Gayrisafi yurtiçi hasıladır. 15 yıllık verilerden elde edilen sonuçlar aşağıda
raporlanmıştır.
ˆ 2.39 0.45i iİTH GSYİH
2( ) 45.413iY Y 2ˆ 11.625iu
( )(4.12)(0.03)iSe
Aşağıdaki 1-4 arası soruları yukarıdaki verileri kullanarak cevaplandırınız.
1) Belirginlik katsayısını hesaplayarak yorumlayınız.
Yukarıdaki veriler göre belirginlik katsayısı
2
2
2
ˆ1
i
i
ur
y
veya 2
2
2
ˆi
i
yr
y
formülleri ile hesaplanabilir. Buna göre öncelikle verilenleri yazalım.
2 2( ) 45.413i iY Y y Toplam değişme (Bütün Kareler Toplamı, BKT)
2ˆ 11.625iu Regresyon ile açıklanamayan değişme (Hata Kareler Toplamı, HKT)
Bu verilere göre ilk tahminciden 2r ‘yi bulabiliriz.
2
2
2
ˆ 11.6251 1 0.744
45.413
i
i
ur
y
veya
2
2
2
ˆi
i
yr
y
Formülünü kullanabilmek için öncelikle 2ˆiy ’nın hesaplanması gerekir.
BKT=RKT+HKT
2 2 2ˆ
iy y u
2ˆ45.413 11.625y
168
2ˆ 45.413 11.625 33.788y
Buradan
2
2
2
ˆ 33.7880.744
45.413
i
i
yr
y
elde edilir. Her iki hesaplama şekli de aynı sonucu vermiştir. Yorum: İthalattaki toplam
değişmenin yaklaşık %75’ i GSYİH ile açıklanmaktadır.
2) Belirsizlik katsayısını hesaplayarak yorumlayınız.
Belirsizlik katsayısı: 21 1 0.75 0.25r
İthalattaki değişmenin yaklaşık %25’i GSYİH ‘nın dışındaki değişkenler tarafından
açıklanmaktadır.
3) İthalat ile GSYİH arasındaki basit korelasyon katsayısı nedir? 2 0.75 0.87r r
İthalat ile GSYİH arasında aynı yönde güçlü doğrusal ilişki vardır.
4) Tahminin standart hatasını hesaplayınız?
2ˆ 11.625ˆ 0.946
2 15 20.894
iu
n
5) Aşağıdaki verileri kullanarak belirginlik katsayısını hesaplayınız.
( i ix X X , i iy Y Y )
2 220.04 52.85 17.94i i i ix y y x
Belirginlik katsayısını,
2
2
2
ˆi
i
yr
y
ile hesaplayabiliriz. Burada toplam değişme olarak verilmiş, ancak 2ˆiy İle
açıklanabilen değişme verilmemiş. 2 2 2
1ˆˆ
i iy x olduğu bilinmektedir. Yukarıdaki
verilerden öncelikle 1 ’i tahmin etmeliyiz.
1 2
17.94ˆ20.
0.89504
21i i
i
y x
x
Böylece belirginlik katsayısı
169
22 2 2
12
2 2
ˆˆ 0.89521 20.040.
52.388
530
8
i i
i i
y xr
y y
olarak hesaplanır. Yukarıdaki verilerden belirginlik katsayısı için ikinci bir yol
aşağıdaki gibidir.
2 2
2
2 2
17.94
20.040.30388
52.85
i i
i i
x yr
x y
Buna göre Y’deki toplam değişmenin yaklaşık %30 X değişkeni ile açıklanmaktadır.
6) Aşağıdakilerden hangisi yanlıştır.
a. Belirginlik katsayısı sıfır ile bir arasında yer alır.
b. Belirginlik katsayısı bire eşit ise bağımlı değişkenin gözlemlenen değerleri ( iY
) ile tahmini değerleri ( ˆiY ) çakışır ki; bu durum tam uyum olarak bilinir.
c. Tahminin standart hatası belirginlik katsayısından daima küçüktür.
d. Tahminin standart hatası bağımlı değişken iY ’nin ölçü birimine bağlıdır.
e. Genelleştirilmiş 2r , bağımlı değişkenin gözlemlenen değerleri ( iY ) ile tahmini
değerleri ( ˆiY ) arasındaki basit doğrusal korelasyon katsayısının karesine eşittir.
7) ˆ 9.67 0.28i iÜCRET EĞİTİM 2 37.1ix
2ˆ 5.629iu n=20
( )(2.91)(0.113)iSe
Ücretlerin eğitim düzeyi ile açıklandığı model için aşağıdakilerden hangisi doğrudur.
a. Regresyonla açıklanan değişme 5.629’a eşittir.
b. Regresyonla açıklanamayan değişme yaklaşık 2.91’e eşittir.
c. Tahminin standart hatası 0.28145’e eşittir.
d. Toplam değişme yaklaşık 8.54’e eşittir.
e. Ücretlerin % 66’sı eğitim düzeyi ile açıklanmaktadır.
8) 32 yıllık veriden tahmin edilen basit bir regresyon için hesaplanan ara sonuçlar 2( ) 83iY Y ,
2ˆ( ) 45iY Y olduğuna göre aşağıdakilerden hangisi yanlıştır?
ˆ 0.89 0.0619Y X 2 0.21r ˆ 0.89
( )(0.27)(0.0291)iSe
a. Regresyon ile açıklanan değişme 38’e eşittir.
b. Belirginlik katsayısı yaklaşık 0.46’dır.
c. Tahminin standart hatası yaklaşık 1.225’dir.
170
d. Korelasyon katsayısı yaklaşık 0.68’dir.
e. Toplam değişme 83’e eşittir.
9) Aşağıdaki idaeleren hangisi doğrudur?
a. 2 2 2ˆ ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y
b. 2 2 2ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y
c. 2 2 2ˆ ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y
d. ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y
e. 2ˆ ˆ( ) ( )i i iY Y Y Y u
Cevaplar: 6.c), 7.d), 8.d), 9.e), 10.a).
171
Bu Bölümde Ne Öğrendik Özeti
Regresyon doğrusunun verilere uyumunu gösteren ölçüleri detaylı olarak ele aldık.
Belirginlik katsayısının hesaplanması iin verilen alternatif formülleri kullanmak amacıyla çok
sayıda uygulama yaptık. Toplam değişme, regresyonla açıklanan değişme ve regresyonla
açıklanamayan değişme kavramlarını ve hesaplanmasını öğrendik.
172
Bölüm Soruları
1) Tahminin standart hatası ……ve……özelliklerinden dolayı uyumun iyiliğini
göstermesi açısından belirginlik katsayısına tercih edilmez.
a) Serbestlik derecesi olması; hata teriminin varyansından hesaplanıyor olması
b) Belirli alt ve üst sınırı olmaması; bağımlı değişkenin ölçü birimine bağlı olması
c) Belirli alt ve üst sınırı olmaması; serbestlik derecesinin olması
d) Her model için uygun bir ölçü olmaması; kalıntı kareler toplamından
hesaplanması
e) Belirginlik katsayısından büyük olması; her zaman hesaplanma imkânı
olmaması
2) Aşağıda verilen sonuçlara göre
2ˆ ˆ1.74 1.307 7.4 0.49 20
ˆ 6.18 2.916
i i i
i
Y X x n
Se
hangisi yanlıştır?
a) Regresyon ile açıklanan değişme 12.64’e eşittir.
b) Regresyon ile açıklanmayan değişme 4.3218’e eşittir.
c) Toplam değişme 8.3182’ye eşittir.
d) Y deki toplam değişmenin yaklaşık %75’i X değişeni ile açıklanmaktadır.
e) X ile Y arasındaki basit korelasyon katsayısı yaklaşık (-0.86)’ya eşittir.
3) Aşağıdakilerden hangisi regresyon doğrusunun uyumunu gösteren bir ölçüdür?
a) Korelasyon katsayısı
b) Belirginlik katsayısı
c) Tahmin edilen parametre
d) Ana kütle hata terimi
e) Tahmin edilen parametrenin standart hatası
4) ˆ 1.74 1.307Y X 2ˆ 15.2iu
2 31.09ix ˆ 25.92
( )(11.18)(2.099)iSe
Yukarıdaki verilere göre belirginlik katsayısının değeri nedir?
a) 0.44
b) 0.22
c) 0.61
d) 0.93
e) 0.78
173
5) Aşağıdaki verilere göre hangi ifade yanlıştır.
22 ˆ108 21i iY Y Y Y
a) Belirginlik katsayısı 0.81’e eşittir.
b) Belirsizlik katsayısı 0.19’a eşittir.
c) Toplam değişme 108’ e eşittir.
d) Regresyon ile açıklanan değişme 87’e eşittir.
e) Kalıntıların karelerinin toplamı 27’ye eşittir
6) ˆ 0.19 0.2794Y X modeli için X’in varyansı 1.2, Y’nin varyansı 0.72 ise
belirginlik katsayısı katsayısının değeri nedir?
a) 0.13
b) 0.46
c) 0.91
d) 0.63
e) 0.72
7) Aşağıdaki ifadelerden hangisi yanlıştır.
a) Genelleştirilmiş 2r , iY ile ˆiY arasındaki basit korelasyonun karesidir.
b) Tahminin standart hatası negatif veya pozitif herhangi bir değer alabilir.
c) Basit regresyonda belirginlik katsayısının kare kökü korelasyon katsayıdır,
işareti eğim parametresinin işaretinden alır.
d) Ana kütle hata terimi varyansının karekökü tahminin standart hatasıdır.
Genelleştirilmiş 2r , belirginlik katsayısına eşittir.
8) ˆ 28.61 101.49Y X 2 96iy
2ˆ 5.7iu
( )(7.92)(14.65)iSe
Aşağıdakilerden hangisi doğrudur?
a) Y deki değişimin %94’ü X tarafından açıklanmaktadır.
b) Y deki değişimin % 0.94’ü X tarafından açıklanmaktadır.
c) Y deki değişimin % 6’sı X tarafından açıklanmaktadır.
d) Y deki değişimin %0.06 ‘sı X tarafından açıklanmaktadır.
e) Y deki değişimin %94 ‘ü X ‘i etkilemektedir.
174
9)
2
2
ˆ 3.81 1.49
( ) (7.92)(14.65)
195
ˆ 8.2
17
i
i
i
i i
Y X
Se
x
u
y x
Aşağıdakilerden hangisi yanlıştır.
a) Gözlem sayısı verilmediği için tahminin standart hatası hesaplanamaz.
b) Belirginlik katsayısı 0.98’e eşittir.
c) Regresyon ile açıklanan değişme yaklaşık 432.9’dur.
d) Toplam değişme yaklaşık 441.1’dir.
e) Basit korelasyon katsayısı yaklaşık 0.99’dur.
10) Aşağıdakilerden hangisi yanlıştır?
a) Regresyon kareler toplamı toplam değişmeden küçüktür..
b) Belirsizlik katsayısı belirginlik katsayısından kesaplanır.
c) Tahminin standart hatası ana kütle hata terimi varyansının kare köküdür.
d) Belirginlik katsayısından hesaplanan basit korelasyon katsayısı işaretini eğim
katsayısının işaretinden alır.
e) Uyumun iyiliğini gösterme açısından tahminin standart hatası belirginlik
katsayısına tercih edilir.
Cevaplar
1) b
2) c
3) b
4) e
5) c
6) a
7) b
175
8) a
9) e
10)e
176
7. UYUMUN İYİLİĞİ VE MODELLEME KONULARI
177
Bu Bölümde Neler Öğreneceğiz?
7.1. Orjinden Geçen Regresyon
7.2. Fonksiyonel Biçimin Belirlenmesi
7.2.1. Log-Log Model ( Tam Logaritmik Model)
7.2.2. Log-Doğrusal Model
7.2.3. Doğrusal-Log Model
7.3. Hata Terimleri için Normal Dağılım Testi : Jarque-Bera Testi
178
Bölüm Hakkında İlgi Oluşturan Sorular
1) Değişkenler arasındaki ilişkiler daima doğrusal mıdır?
2) Değişkenler arasında doğrusal olmayan ilişkiler için hangi fonksiyonel kalıplar
kullanılır?
3) Hata terimi için normal dağılım varsayımını nasıl test edebiliriz?
179
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Modelin Fonksiyonel Biçimi
ve Doğrusal Olmayan
Modeller
Log-log model, log-doğrusal
model ve doğrusal-log
modelin özelliklerini
anlamak ve parametrelerini
yorumlayabilmek
Ders notları ve uygulamalı
örnekler tekrar ederek
Orjinden Geçen Regresyon
Modeli
Orjinden geçen regresyonun
kendine özgü özelliklerini
öğrenmek
Ders notları
Hata Reriminin Normallik
Varsayımı
Jarque-Bera testini
uygulayabilmek
Ders notları ve uygulamalı
örnekler özümsennerek,
mümkünse çözümü yapılan
regresyon modelleri için JB
testini uygulayarak
180
Anahtar Kavramlar
Eğim
Esneklik
Değişkenin dönüştürülmesi
Log-log model
Log-doğrusal model
Doğrusal-log model
Çarpıklık
Basıklık
Jarque-Bera testi
Orijinden geçen regresyon
Ham 2r
Merkezi Limit Teoremi
181
Giriş
Regresyon modeli iktisadi bir zorunluluk varsa, sabit terim içermeyebilir. Orjinden
geçen regresyon olarak adlandırılan sabit terimsiz regresyon modeli yine EKK yöntemi ile
tahmin edilmekte ancak bu dersimize kadar özellikle üzerinde durduğumuz bazı özelliklere
sahip değildir. Bu dersimizde orijinden geçen regresyon modeli genel bir çerçevede ele
alınacaktır.
Ayrıca yine bu dersimize kadar değişkenler arasındaki ilişkilerin doğrusal olduğunu
varsaydık. Ancak tüketim, arz, talep gibi bazı iktisat teorileri için doğrusal ilişki geçerli
olmayabilir. Değişkenler arasındaki ilişki doğrusal değilse, bu tür ilişkiler için hangi fonksiyon
kalıpları uygundur ve bunların özellikleri nelerdir? Bu soruların cevabını araştıracağız.
Bilindiği üzere, regresyon modelinin tahmini sonrasında varsayımların gerçekleşip
gerçekleşmediği test edilmelidir. Bu bağlamda hata terimlerinin normal dağıldığı varsayımı test
edilecektir.
182
7.1. Orijinden Geçen Regresyon
Basit regresyon modeli bazı durumlarda aşağıdaki gibi yazılabilir.
1i i iY X u
Bu modelde sabit terim (otonom parametre, kesim parametresi) yer almamaktadır.
Regresyon doğrusu (0,0) noktasından geçmekte, bu nedenle de orijinden geçen regresyon ile
adlandırılmaktadır. Bu alt bölümde orijinden geçen regresyon modelinin tahmini ve özellikleri
üzerinde durulacaktır. Bu amaçla öncelikle örnek regresyon modelini aşağıdaki gibi yazılır.
1ˆ ˆ
i i iY X u
1 parametresinin tahmini için EKK yöntemi uygulanır. Kalıntıların kareleri toplamını
fonksiyonunda 1 ’e göre kısmi türev alınır ve sıfıra eşitlenirse, 1 parametresinin EKK
tahmincisi aşağıdaki gibidir.
1 2ˆ i i
i
X Y
X
Önemli uyarı: Yukarıdaki tahminciyi 0 1i i iY X u modelinde
1 in EKK
tahmincisi 2
1ˆ
i i ix y x ile karıştırmayın. Buradaki i ix X X , i iy Y Y iken,
orijinden geçen regresyonda 1 in EKK tahmincisinde gözlemlenen (teorik) iX ve iY yer
almaktadır.
1 ’in varyansının tahmincisi ise aşağıdaki gibidir.
2
1 2ˆ
i
VarX
Yine burada ana kütle rassal hatanın varyansı bilinmemekte, aşağıda verilen tahminci
ile tahmin edilmektedir.
2
2ˆ
ˆ1
iu
n
Sadece bir tane parametre tahmin edildiği için, serbestlik derecesi n-1’e eşittir.
Orijinden geçen regresyon modelinin sabit terimli modellerden önemli farklılıkları
vardır. Orijinden geçen regresyonda kalıntıların toplamının ( ˆiu ) sıfır olması gerekmez.
Önemli bir diğer özelliği belirginlik katsayısının aldığı değerdir. Uyumun iyiliği ölçüsü
183
belirginlik katsayısının 0 ile 1 değerleri arasında yer alması gerektiğini önceki derslerimizde
öğrenmiştik. Bunun tek istisnası orijinden geçen regresyon olup, bu modelde belirginlik
katsayısı negatif değer alabilmektedir. Bu nedenle orijinden geçen regresyonda 2r değil, ham 2r hesaplanır ve yorumlanır. ham 2r aşağıdaki gibi tanımlanır.
2
2
2 2
i i
i i
X Yham r
X Y
ham 2r , 0 ile 1 arasında değer alır. Ancak alternatif modellerin karşılaştırılması ham 2r ile 2r
’nin mukayese edilmesi uygun değildir.
İktisadi bir zorunluluk yoksa, orijinden geçen regresyon modelin kurulması tavsiye
edilmez, çünkü 0 ’ın istatistiksel açıdan anlamsız olması, orijinden geçen bir regresyona sahip
olduğumuz anlamına gelmektedir. Ayrıca 0 ’ın modelde yer alması gerektiği halde yer
verilmemişse, bu durum model kurma hatasına sebep olacaktır.
7.2. Fonksiyonel Biçimin Belirlenmesi
Şimdiye kadar bağımlı değişken Y ile bağımsız değişken X arasında doğrusal bir
ilişkinin olduğunu varsaydık. Diğer bir ifade ile temel ekonomik ilişkiyi, doğrusal bir
fonksiyon (0 1( | )i i iE Y X X ) olarak ele aldık. Söz konusu durum ( )iE Y ve 𝑋 arasında
doğrusal, düz-doğru bir ilişkinin var olduğu anlamına gelmektedir.
Ancak bütün ekonometrik analizlerin başlama noktası iktisat teorisidir ve temel
ekonomik ilişki regresyon fonksiyonu ile doğru biçimde formüle edilmelidir. Burada
kastedilenin ne olduğunu tüketim modeli çerçevesinde inceleyelim. Diğer değişkenler sabit
iken tüketim harcaması ve gelir arasındaki ilişki hakkında iktisat teorisi gerçekte ne
söylemektedir? Tüketim harcamalarının zorunlu bir harcama olması nedeniyle, teoriye göre
gelir ile tüketim arasında pozitif bir ilişkinin olması beklenmektedir. Ancak iktisat teorisi bu
ilişkinin düz bir doğru olması gerektiğini iddia etmez. Çünkü doğrusal ilişki, hane halkı geliri
arttıkça tüketim harcamalarının aynı sabit oranda süresiz olarak artmaya devam edeceği
anlamına gelir ki; bu iktisadi gerçeklere uygun değildir. Gelir yükseldikçe, tüketim
harcamalarının artması ancak bu artışın azalan bir oranda olması beklenir. Diğer bir ifade ile
gelir artarken tüketim harcamaları da mutlak olarak artacak ancak nispi olarak yani tüketimin
gelirdeki payı azalacaktır. Böyle bir ilişki grafiksel olarak, iki değişken arasında düz-doğru bir
ilişkinin olmadığını ifade etmektedir. Doğrusal ilişkide eğim sabit olduğu için gelir arttıkça
tüketim de aynı oranda artmaktadır, marjinal etki sabittir.
184
Şekil 7.1 Tüketim harcaması ve gelir arasında doğrusal olmayan bir ilişki.
Şekil 7.1’deki gibi eğrisel bir ilişki için, açıklayıcı değişkendeki bir değişimin
marjinal etkisi belirli bir noktadaki kavise teğetin eğimi ile ölçülmektedir. X’teki bir değişimin
marjinal etkisi ( 1 1,X Y ) noktasında ( 2 2,X Y ) noktasına göre daha büyüktür. X arttıkça, 𝑌’nin
değeri artmaktadır, ancak eğim daha düşük olduğu için, bu artış “azalan oranda bir artış”
anlamındadır. Tüketim harcaması modeli için iktisadi açıdan bunu şöyle açıklayabiliriz.
Tüketim harcaması için düşük gelirlilerde marjinal tüketim eğilimi daha büyük ancak gelir
artıkça marjinal eğilim (marjinal tüketim meyli) azalmaktadır.
Basit doğrusal regresyon modeli esnek bir modeldir. X ve Y değişkenleri dönüştürülerek
doğrusal olmayan ilişkiler, doğrusal regresyon modeli çerçevesinde ele alınabilir ve
dönüştürülmüş değişkenlerin yer aldığı bu model için doğrusal regresyon modeli ile ilgili
kurallar kullanılabilir.
Değişkenler arasındaki ilişki için cebirsel bir şekil seçme, orijinal değişkenlerin
dönüşümlerinden birini seçme anlamına gelmektedir. Ekonometrik modellerde Değişken
dönüştürmeleri için doğal logaritmanın kullanımı oldukça yaygındır. Logaritmik dönüşümler
ücretler, maaşlar, gelir, fiyatlar, satışlar ve harcamalar gibi parasal değerleri olan değişkenler
ve genelde “büyüklüğü” ölçülen değişkenler için kullanılmaktadır.
Şekil 7.2 ’de yer alan grafiklerde 2X , 3X gibi kuvvet alınarak değişken
dönüştürme ve ln( )X dönüştürmeleri kullanılmıştır. Değişkenler yukarıdaki gibi
dönüştürülürse, karşılaşılan zorluk regresyon sonucunun değişik yorumlanmasıdır. Her farklı
fonksiyonel biçim için, hem eğim hem de esneklik ile ilgili ifadeler doğrusal ilişkide
olduğundan farklıdır. Çünkü değişkenler arasında doğrusal olmayan bir ilişkili vardır.
185
Şekil 7.2. Alternatif fonksiyonel şekiller.
Değişkenlerin dönüştürülmesi ile elde edilen sonuçların yorumlanması doğrusal
regresyon modelinde olduğundan farklıdır.
Logaritmik dönüşümler ile ilgili üç mümkün yapılandırma ve yorumları aşağıdaki
gibidir.
7.2.1. Log-Log Model (Tam Logaritmik Model)
Doğrusal olmayan modellerden öncelikle log-log model diğer bir ifade ile tam
logaritmik model ele alınacaktır. Log –log model aşağıdaki üstel regresyondan elde
edilmektedir. Buna göre aşağıda verilen regresyon modeli,
1
0iu
i iY X e
parametrelerinin özelliğinden dolayı doğrusal değildir. Çünkü Y ile X arasında ilişki kuran 1
parametresi değişken ile çarpılır değil, değişkenin üssü durumdadır. Ayrıca hata terimi
toplanabilir nitelikte olmayıp, çarpılır bir değer niteliğindedir. Eğer model; 1
0i i iY X u ise
hata terimi çarpılır biçimdedir. Ancak bu durumda ( ) 0iE u = varsayımı geçerli değildir.
186
1
0iu
i iY X e modelinde ise klasik doğrusal regresyon modelinin temel varsayımları
geçerliliğini korumaktadır.
2 2( ) 0 ( ) ( ) 0 için ( ) 0i i i j i iE u E u E u u i j E u X
1
0iu
i iY X e modeli her iki tarafının doğal logaritması alınarak aşağıdaki gibi de
gösterilebilir.
0 1ln ln lni i iY X u
Log-Log model ile adlandırılan bu modelin kullanılabilmesi için hem 𝑌 hem de 𝑋 ‘in
sıfırdan büyük olması gerekmektedir. Çünkü logaritma sadece pozitif sayılar için
tanımlanmaktadır. Burada * lni iY Y= ,
* lni iX X= ve *
0 0ln gösterilerek dönüştürülmüş
yeni bir model
* * *
0 1i i iY X u
elde edilir ve modele en küçük kareler yöntemi uygulanarak, parametreler (*
0 , 1 ) tahmin
edilir.
Log-Log model için iki önemli nokta vardır.
Log-Log modelde değişkenler, aritmetik değerleriyle değil doğal logaritmik
değerleriyle yer alırlar. Bu sebeple model logaritmik doğrusal veya
doğrusallaştırılmış model olarak da bilinmektedir.
Log-Log modelde 1 ’in tahmini Y’nin X’e göre sabit esnekliğini verir.
1YX
dY X
dX Y Y’nin X’e göre sabit esnekliği
Şekil 7.2 ‘e bakarak, iktisatçıların sabit esnekliği belirlemek için çok sık olarak neden
log-log model kullandığını görebilirsiniz. Panel (c) 1 1 ise ilişki bir arz eğrisini , 10 1
ise bir üretim ilişkisini gösterebilir. Panel (d)’de 1 0 ise bu ilişki bir talep eğrisini
gösterebilir. Her durum da esneklik sabit olup yorum için uygundur.
187
İSPAT (Okuyucunun isteğine bağlı)
1 ’in, Y’nin Xi’e göre sabit esnekliğine eşit olduğunu göstermek için esneklik
formülünü yeniden yazalım.
YX
dY X
dX Y
Y fonksiyonunda X’e göre kısmi türevi alınır.
1 1 11 1
1 0 1 0 0
u u udYX e X X e Y X e
dX
için
1
1 1
YX Y
X elde edilir.
Elde edilen bu sonucu esneklik denkleminde yerine koyar ve matematiksel
sadeleştirmeleri yaparsak;
1 1YX
dY X Y X
dX Y X Y
Y’nin X1’e göre sabit esnekliğinin 1 parametresine eşit olduğu sonucuna ulaşılır.
Log-Log modelde tahmin edilen parametreler doğrusal modelde olduğu gibi eğimi
değil, esnekliği ifade ettiği için yorumları da buna bağlı olarak değişecektir. Örneğin 1
parametresi için, “X’deki %1 lik değişmeye karşılık Y ,% 1 kadar değişecektir” yorumu
yapılır.
İktisat derslerinde gördüğünüz Cobb-Douglas tipi üretim fonksiyonu log-log modele
örnek teşkil eden iktisadi bir modeldir.
uQ AK L e
Modelde Q üretim hacmi, K sermaye ve L emek değişkenleri, A ise teknoloji seviyesini
gösteren sabit parametredir. Modelin doğrusallaştırılmış biçimi;
ln ln ln lni i i iQ A K L u
ile gösterilir. ve parametrelerinin tahmini,
ˆQ K
K Q
Sermayenin marjinal verimlilik esnekliği
188
ˆ Q L
L Q
Emeğin marjinal verimlilik esnekliğinin
tahminini verir ve tahmin edilen esneklikler her noktada sabittir. Sermayedeki %1’lik değişim
üretimi % , emekteki %1’lik değişim üretimi % kadar değiştirecektir.
Bir başka örnek olarak aşağıdaki talep modelini verebiliriz.
1 2
0
u
X XD P Y e modelinde D, X malının talebini P, X malının fiyatını, Y ise X malını
talep edenlerin ortalama gelirini ifade etmektedir.
Modelin parametreleri;
1ˆ X X
X X
D P
P D
Talebin Fiyat esnekliği
2ˆ X
X
D Y
Y D
Talebin Gelir esnekliğinim
tahminini verir.
Log-log fonksiyonel şekil, çoğunlukla talep denklemleri için kullanılmaktadır.
𝑃 =Tavuk reel fiyatı (lira) 𝑄 =Kişi başına tavuk tüketimi, (kilo), için 52 gözlem Şekil
6.16’da gösterilmektedir. Bu, Şekil 4.5(d)’de gösterilen karakteristik hiperbolik şekil
göstermektedir.
Şekil 7.3 Tavuğun Miktar ve Fiyatı
Tahmin edilmiş log-log model :
189
ˆln( ) 2.72 1.38ln( )
ˆ( ) (1.04) (0.05)i
Q P
Se
Regresyon modelin sonucuna göre fiyattaki %1’lik bir artış tavuk tüketim miktarını
%1.38 azaltacağı tahmin edilmektedir. Talebin fiyat esnekliğinin 1.38 olduğu tahmin edilmiştir.
7.2.2. Log-Doğrusal Model
İktisatta alanında GSMH, dış ticaret açığı, cari açık, para arzı gibi iktisadi
büyüklüklerin büyüme oranları önemli göstergelerdir. Ekonometrik analizlerde iktisadi
büyüklüklerin üyüme oranını tahmin etmek için Log-doğrusal model kullanılmaktadır.
Log_doğrusal model,
0 1lnY X
ile gösterilmektedir. Model sol tarafta logaritmik bir terime ve sağ tarafta ise dönüştürülmemiş
(doğrusal) bir değişkene sahiptir. Kısaca sadece bağımlı değişken logaritması alınması suretiyle
dönüştürülmüş bir değişkendir. Bağımlı değişkeni bu şekilde kullanılabilmesi sıfırdan büyük
olmasını gerektirmektedir, 0Y .
Log-doğrusal fonksiyon
0 1X
iY e
ile gösterilen üstel bir fonksiyon olup, bu fonksiyonun her iki tarafının doğal logaritması
alınması suretiyle 0 1lnY X biçimine dönüşmüştür.
Log-dog model için her noktadaki eğim 1Y olup , 1 0 olması Y’nin daha büyük
değerleri için marjinal etkinin arttığı anlamına gelmektedir. Fonksiyonda marjinal etki artan bir
oranda artmaktadır.
Log-doğrusal modelin şekilleri Şekil 7.2 (e)’de gösterilmektedir. ve fonksiyonun türevi
ve esnekliği Tablo 4.1’de verilmektedir. Log-doğrusal modelde 1 , ln Y nin X’e göre türevidir
1
ln 1 1 'deki nisbi değişme
ln 'deki mutlak değişme
d Y X dY dY Y
dX Y Y dX Y dX X
190
ve esneklik
1X ’e eşittir.
Modelin yorumu logaritmanın özellikleri kullanılarak elde edilebilmektedir. Log-
doğrusal modelde, X ’teki bir birimlik artış, Y’de yaklaşık olarak % 1 bir değişime yol
açmaktadır.
Y’deki % 1 ‘lik değişme 100 ile çarpılırsa, X’deki 1 birimlik değişmeye karşılık Y’deki
yüzde değişme ya da büyüme oranı elde edilir.
Şekil 7.2 ‘de mümkün şekiller yer almaktadır. 1 0 ise fonksiyon artan bir oranda
artmaktadır 1 0 ise, fonksiyon azalan bir oranda azalmaktadır.
İSPAT (Okuyucunun isteğine bağlı)
Yukarıdaki 1
1dY
Y dX eşitliğinden;
1
YY
X
elde edilir. Esneklik denkleminde dY dX yerine 1Y yazılır ve
sadeleştirmeler yapılırsa,
1 1YX
Y X XY X
X Y Y
sonucuna ulaşılır. Böylece Log-Doğrusal modelde
esneklik 1X ’e eşittir.
Log-doğrusal modelde özel olarak eğim, örneklem ortalaması Y ile, esneklik ( 1ˆ X )
ise örneklem ortalaması X ile değerlendirilebilmektedir.
Büyüme modelleri log-doğrusal modellere iyi bir örnek teşkil etmektedir. Teknolojik
gelişmelere bağlı üretilen buğday veriminin (hektar başına ton) her yıl yaklaşık olarak sabit bir
oranda arttığını varsayalım. 𝑡 yılındaki verimin, 1 yılda sabit büyüme oranı olan g ile
1(1 )t tVERİM g VERİM
olduğunu varsayalım. Tekrarlı yerine koyma işlemi ile 0(1 )t
tVERİM g VERİM elde edilir.
Burada 0VERİM örneklem başlamadan önceki yıl olan “0” yıldaki verimdir, böylece bu
muhtemelen bilinmemektedir. t ise zamanı t=1,2,3,….,T göstermektedir.
191
0(1 )t
tVERİM g VERİM
Denkleminin her iki tarafının logaritması alınarak
0ln ln ln 1tVERİM VERİM g t
0 1ln tVERİM t
elde edilir. Model, bağımlı değişkeni ln tVERİM bağımsız değişkeni ise zaman (t) olan
basit bir log-doğrusal modeldir. ln tVERİM geometrik dizi iken, t (=1,2,3,….) zamanı
gösterdiği için aritmetik seri özelliği taşır.
Büyümenin pozitif olması beklendiği için 1 0 ‘dür. İlişkinin grafiği, Şekil 7.2(c)’teki
gibi yukarı-eğimli eğriye benzemektedir.
Verim için log-doğrusal model tahmini aşağıdaki gibi ise, modelin parametrelerini
yorumlayalım.
ln 0.381 0.0181
ˆ( ) (0.0419)(0.0023)
t
i
VERİM t
Se
Tahmin edilmiş katsayı 1ˆ ln(1 ) 0.0181g ’dir. Ancak amacımız ln(1 )g ’yi
değil, g’yi tahmin etmektir. Bunun için 0.0181’in anti log’u alınır 1+g= 1.01826 ve bu değerden
1 çıkarılırsa g 0.01826 olarak tahmin edilir. Buna göre buğday verimindeki büyüme oranının
verinin dönemi boyunca yılda yaklaşık olarak �� = 0.01826 veya yaklaşık %1.82 olduğunu
tahmin etmekteyiz.
7.2.3. Doğrusal-log Model
Doğrusal-log modelin sol tarafında doğrusal, dönüştürülmemiş bir terim ve sağ
tarafında logaritmik bir terim yer alır ve
0 1 ln( )Y X
ile gösterilir. Logaritmanın özelliğinden dolayı, bu fonksiyonda 0X olması gerekmektedir.
1 ’in işaretine bağlı olarak artan veya azalan bir fonksiyondur. Fonksiyonda X’in
Y’ye göre marjinal etkisi (eğim);
192
1dY dX Y X X
olup, X arttıkça mutlak olarak azalmaktadır. Böylece eğim (marjinal etki) her noktada
değişmektedir. 1 0 ise fonksiyon azalan bir oranda artmakta, 1 0 ise, fonksiyon azalan bir
oranda azalmaktadır. Fonksiyon şekilleri Şekil 7.2 (f)’te gösterilmektedir.
Esneklik ise1 Y ’e eşit olup Y’nin aldığı her değere göre değiştiği görülmektedir.
İSPAT (Okuyucunun İsteğine bağlı)
Esneklik ise 1dY dX X ’den aşağıdaki gibidir.
1 1YX
Y X X
X Y X Y Y
Bu aşamada Doğrusal –log model için tüketim örneği verilecektir
Gelir (Y-1000lira) artarken tüketimin harcamalarının (C-100 lira) azalarak artması, gelir
ile tüketim harcamaları ilişkinin doğrusal-log denklemi ile araştırılmasını gerektirir. Buna göre,
doğrusal-log tüketim modeli aşağıdaki gibidir.
0 1 ln( )i i iC Y u
1 0 ise bu fonksiyon azalan bir oranda artacaktır. Buna göre gelir (Y) artarken
eğim 1 Y azalmaktadır. Bu bağlamda eğim, ek gelirden tüketim için marjinal harcama
eğilimidir. Benzer şekilde, esneklik 1 C olup, tüketim harcamasının daha büyük düzeyleri
için bu değer daha küçüktür. Bu sonuçlar yüksek gelirler ve büyük tüketim harcamalarında,
gelirde bir artışın etkisinin tüketim harcaması üzerine etkisinin küçük olduğu iktisat teorisi ile
tutarlıdır.
Aşağıda tüketim harcamaları için tahmin edilmiş doğrusal-log modeli verilmiştir.
ˆ 34.8 117.94ln( )
ˆ( ) (26.14)(31,09)
i i
i
C Y
Se
doğrusal-log model, tüketim üzerine ek geliri harcamak için marjinal eğilimin azalmasını
bekleyen teorik modelimiz ile tutarlıdır. 1,000 lira haftalık harcanabilir geliri olan bir hane
halkının 100 liralık bir ek gelirden tüketim için 11.794 ek harcama yapacağı tahmin edilmiştir.
oysa haftada 2,000$ gelirli bir hane halkının ek 100$ bir gelirden ek bir 6.62$ harcayacağını
tahmin etmekteyiz. Gıda harcaması üzerine gelirin marjinal etkisi gelirin daha yüksek
düzeylerinde daha küçüktür. Bu, 100$’lık gelirde bir değişimin marjinal etkisi gelirin bütün
193
düzeyleri için 10.21$ olduğunda orijinal olarak tahmin ettiğimiz doğrusal, düz-doğru ilişkiden
bir değişimdir.
Alternatif bir yorum ; gelirdeki %1 bir artışın haftada yaklaşık olarak 1.17 lira tüketim
harcamasını arttıracaktır, veya gelirdeki %10 ‘luk bir artış tüketim harcamasını yaklaşık 11.79
lira arttıracaktır. Bu yorum, gıda harcaması üzerine gelirin azalan marjinal etkisini belirtmek
için uygun basit olmasına rağmen, her ne kadar ima edilse de biraz gizlidir. Haftada 1,000$
gelirde, %10 bir artış 100$ iken 2,000$ gelirde %10 bir artış 200$’dır. Gelirde daha büyük bir
dolar artışı gelirin daha yüksek düzeylerinde gıda üzerine ek bir 13.22$ harcama meydana
çıkarması için gereklidir.
Tablo 7.4 Bazı Yararlı Fonksiyonlar, onların Türevleri, Esneklikleri ve Diğer Yorumu
Bağımlı ve bağımsız değişkenlerin farklı dönüştürmelerini kapsayan ve bunlardan
bazıları benzer şekillere sahip olan alternatif modeller verilmişken, bir fonksiyonel şekli
seçmek için kural nedir? Uygun ekonometrik modelin fonksiyonel şekli;
1. İktisat teorisinde belirtilen ilişki ile tutarlı olmalıdır.
2. En küçük kareler tahmin edicilerinin arzu edilen özelliklere sahip olabilmesi için 1-
6 varsayımları sağlamalıdır.
3. Veriye uyumunu sağlayacak esnek bir yapı olmalıdır.
Ekonomik değişkenler arasında “gerçek” fonksiyonel ilişki asla bilinmediği için seçilen
fonksiyonel şekil ne kadar iyi olursa olsun sadece bir yaklaşmadır.
194
7.3. Hata Terimleri için Normal Dağılımın Testi: Jarque-Bera Testi
Parametreler için hipotez testleri ve aralık tahminlerinin, hataların normal dağıldığı
varsayımına dayandığını önceki derslerimizden biliyoruz. Hata teriminin normal dağıldığı
varsayımı çoğu zaman gerçekleşmesi beklenen bir varsayımdır. Bunun nedeni; hata terimlerinin
genellikle modele dahil edilmeyen çok sayıda bağımsız değişkenin etkisini temsil etmesidir.
Hata teriminin modelde yer almayan değişkenlerin bileşik etkisini yansıtmakta ve bu
etkinin rassal olması beklenmektedir Merkezi Limit Teoremine (MLT) göre, rastlantısal
değişkenlerin sayısı artarken dağılımları ne olursa olsun toplamları normal dağılıma
yaklaşacaktır. MLT’ye göre, örnek birim sayısının artması halinde, Y’ler normal dağılmasa bile,
parametre tahminleri asimptotik olarak normal dağılacaktır.
Büyük örneklemlerde MLT den dolayı hataların normal dağıldığı varsayımı yerine gelse
de, regresyon hatalarının normal dağılıma uygun olması arzu edilen bir özelliktir.
Hatalar normal olarak dağılmazlar ise, alternatif bir fonksiyonel şekil veya bağımlı
değişken dönüştürmesini dikkate alarak model iyileştirilebilir.
Gerçek rassal hatalar gözlemlenemediği için, normallik testinde EKK kalıntıları
kullanılmaktadır.
Normallik varsayımının testi için bir çok test vardır. Normallik için kullanılan
testlerden Jarque-Bera testi çarpıklık ve basıklık ölçülerine dayanmaktadır. Jarque-Bera
testinde EKK kalıntılarından hesaplanan eğiklik ve basıklık ölçüleri kullanılmaktadır. Normal
dağılım simetrik bir dağılım olduğu için çarpıklık (S) 0, basıklık (K) 3’e eşittir.
Jarque-Bera (JB) test istatistiği kalıntıların normal dağıldığı temel hipotezi alında
çarpıklık ve basıklık ölçülerinden aşağıdaki gibi hesaplanmaktadır. Çarpıklığın büyük değerleri
ve/veya 3’ten oldukça farklı basıklık değerleri Jarque-Bera istatistiğinin büyük bir değerine yol
açacaktır.
222
2
3
6 24
KSJB n
Kalıntılar normal dağılırsa Jarque-Bera istatistiği iki serbestlik derecesi ile bir ki-kare
dağılımına sahiptir. İstatistiğin hesaplanan değeri iki serbestlik derecesi ile ki-kare
dağılımından seçilen bir kritik değeri büyük ise hataların normal dağıldığı temel hipotezi
reddedilir İki serbestlik derecesi ile bir 𝜒2 −dağılımından %5 kritik değer 5.99’dur ve %1
kritik değer 9.21’dir
JB test istatistiğinde yer alan eğiklik (S) ve basıklık (K) ölçüleri momentler yoluyla
hesaplanır.
195
333
ˆS
, 4
44
ˆK
MOMENTLER
İstatistik derslerinizden momentler konusunu hatırlayacak olursanız, ortalaması
olan X değişkeninin momentleri aşağıdaki eşitlikten hesaplanmaktadır.
0,1,2,3,4r
r E X r
Buna göre 0., 1., 2.,3. ve 4. momentler aşağıdaki gibidir.
0
0 1E X
1
1 E X E X
2 2
2 XE X
3
3 E X
4
4 E X
Momentler ölçü birimine bağlı oldukları için JB tets istatistiğinde çarpıklık ve basıklık
ölçüleri olarak ölçü birimlerinin etkisi giderilmiş (S ve K) momentleri kullanılmaktadır2.
E(u)=0 hata terimlerinin beklenen değeri sıfır olduğu ve aynı zamanda hata terimlerinin
yerine kalıntıların ikame edilebileceği göz önüne alınacak olursa momentler aşağıdaki gibidir.
2
2
2
ˆiu
n
,
3
3
ˆiu
n
,
4
4
ˆiu
n
JB testi için emel ve alternatif hipotez aşağıdaki gibidir.
H0: S=0 ve K=3 (Kalıntılar normal dağılıma uygundur.)
H1: S 0 ve/veya K 3 (Kalıntılar normal dağılıma uygun değildir.)
Hesaplanan test istatistiği 2 sd’li ki-kare tablosu ile karşılaştırılır. Hesaplanan test
istatistiği tablo değerinden küçükse H0 hipotezi, büyükse H1 hipotezi kabul edilir. Tam
2 Yukarıdaki eşitliklerden görüldüğü üzere 0. Moment 1’e, 1. Moment X’in ortalamasına, 3. Moment X’in
varyansına eşittir.
196
logaritmik modellerde (log-log modeller) JB testi uygulanırsa kalıntıların antilogaritmaları
alınır.
Aşağıda raporlanmış sonuçlara göre kalıntıların normal dağılıma uygun olduğu
varsayımının testinin aşamalarını birlikte görelim.
2ˆ 52.35 0.138 14 39.023 0.82
(37.285) (0.0187)
0.989512 3.5452
i iY X n r
S K
Temel ve alternatif hipotezler
H0: S=0 ve K=3
H1: S 0 ve/veya K 3
Test istatistiği
2 2 2 2( 3) (0.989512) (3.5452 3)14
6 24 6 24
S KJB n
2.458JB
Tablo değeri
2
2 5.99
Karar
2
22.458 5.99JB için kalıntıların normal dağıldığı temel hipotezi reddedilemez.
197
Uygulamalar
1. 𝑃 =Tavuk reel fiyatı (lira)
𝑄 =Kişi başına tavuk tüketimi, (kilo),
için 52 gözlem Şekil 7…gösterilmektedir. Bu, Şekil 4.5(d)’de gösterilen karakteristik
hiperbolik şekil göstermektedir.
Şekil 7… Tavuğun Miktar ve Fiyatı
Tahmin edilmiş log-log model :
ˆln( ) 2.72 1.38ln( )
ˆ( ) (1.04) (0.05)i
Q P
Se
Regresyon modelin sonucuna göre fiyattaki %1’lik bir artış tavuk tüketim miktarını
%1.38 azaltacağı tahmin edilmektedir. Talebin fiyat esnekliğinin 1.38 olduğu tahmin edilmiştir.
2.Çalışma ekonomisinde ücretler ve eğitim arasındaki ilişki en çok araştırılan konudan.
birisidir. Eğitimin her bir yılı için getiri oranının sabit bir 𝑟 olduğunu varsayalım. Yani, ilk
yıldaki ücret oranı 0ÜCRET ise, ücret eğitimin ek bir yılından sonra başlangıç değeri 0ÜCRET
’dan 1 0(1 )ÜCRET r ÜCRET ’a yükselmektedir. Ekstra iki yıllık bir eğitim için
2
2 0(1 )ÜCRET r ÜCRET ve benzeri olmaktadır. ln( )ÜCRET ve eğitim yılları (EY)
arasındaki bu ilişki için aşağıdaki model kurulur
0(1 )EY
tÜCRET r ÜCRET
buradan
0ln ln ln 1tÜCRET ÜCRET r EY
198
0 1ln tÜCRET EY
Eğitimin ek bir yılı için ücretlerde yaklaşık 1ˆ%100 ‘lük bir artışa yol açmaktadır.
Aşağıdaki gibi tahmin edilen modeli yorumlayalım.
ln 2.203 0.078
( ) (0.087) (0.001)
t
i
ÜCRET EY
SE
Tahmin edilmiş katsayı 1ˆ ln(1 ) 0.078r ’dir. 0.078’in anti log’u alınır
1+r=1.0822 değerine ulaşılır. 1.0822’den 1 çıkarılırsa r, 0.0822 olarak tahmin edilir.
Bu sonuca göre eğitimin ek bir yılı ücret oranını yaklaşık olarak %8 arttırdığı tahmin
edilmektedir.
3.Tahmin edilen regresyon modelinden aşağıdaki ara sonuçlar hesaplanmıştır.
2ˆ 24.649iu , 3ˆ 89.908iu ,
4ˆ 414.816iu n=13
Kalıntıların normal dağıldığı hipotezini test ediniz.
Bu uygulamada bir önceki uygulamadan farklı olarak JB test istatistiğindeki çarpıklık
(S) ve basıklık (K) ölçüleri verilmemiştir. S ve K ölçüleri yukarıdaki kalıntılar ile ilgili ara
sonuçlarda hesaplanabilir.
Eğiklik: 3
3
ˆS
Basıklık: 4
4
ˆK
Öncelikle eğiklik ve basıklık ölçülerinde yer alan 3. Moment ( 3 ) ve 4. Moment ( 3 )
‘in hesaplanması gerekir. Ayrıca 3 ve 4 hesaplanabilmesi için varyansa eşit olan 2.
Momentin ( 2 ) de hesaplanması gerekir.
2
2
2
ˆ 24.649ˆ 1.896
13
iu
n
3
3
ˆ 89.908ˆ 6.916
13
iu
n
4
4
ˆ 414.816ˆ 31.909
13
iu
n
199
Yukarıdaki sonuçlara göre 2. Moment ( 2 ) 1.896 ‘ya eşittir. Buna göre kalıntıların
varyansı 2 1.896 ’ eşittir. Buradan 3 ve 4 hesaplanır.
2 1.896 ise 1.377
3 2 1 1.896 1.377 2.611
3 2 2 1.896 1.896 3.594
Bu aşamada eğiklik (S) ve basıklık (K) ölçüleri hesaplanabilir.
Eğiklik: 3
3
ˆ 6.9162.649 0
2.611S
Sağa çarpık
Basıklık: 4
4
ˆ 31.9098.879 3
3.594K
Sivri
Bilinmeyenler hesaplandığına göre, JB testini uygulayabiliriz.
Temel ve alternatif hipotezler
H0: S=0 ve K=3
H1: S 0 ve/veya K 3
Test istatistiği
2 2 2 2( 3) (2.649) (8.879 3)13
6 24 6 24
S KJB n
33.905JB
Tablo değeri
2
2 5.99
Karar
2
233.905 5.99JB için alternatif hipotez kabul edilir, kalıntıların normal
dağılıma uygun değildir.
200
Uygulama Soruları
1) Orjinden geçen regresyon modeli için aşağıdaki ifadelerden hangisi yanlıştır.
a) Sabit terim yer almaz.
b) Belirginlik katsayısı negatif çıkabilir.
c) Kalıntıların toplamının sıfır olması gerekmez.
d) Uyumun iyiliği için ham 2r hesaplanır. ham 2r 0 ile 1 arasında değer alır.
e) Alternatif modellerin seçiminde ham 2r , 2r ’den büyükse orjinden geçen
regresyon tercih edilir.
2) 493i iX Y , 2 638iX verilerini kullanarak 1
ˆˆi iY X modelini tahmin
ediniz.
a) ˆ 0.77i iY X
b) ˆ 1.29i iY X
c) Yukarıdaki veriler modelin tahmini için yetersizdir.
d) ˆ 6.19i iY X
e) ˆ 40.85i iY X
3) ˆln 8.75 0.83lnY X modelinin yorumu aşağıdakilerden hangisidir?
a) Ln X’deki %1’lik değişme ln Y’yi % 83 düşürür.
b) X’deki %1 birimlik değişme lnY’yi % 0.83 birim düşürür.
c) X’deki %1’lik değişme Y’yi % 0.83 düşürür.
d) X’deki %1 birimlik değişme Y’yi % 83 birim düşürür.
e) X’deki 1birimlik değişme Y’yi % 83 birim düşürür.
4) ˆln 2.65 0.61Y X modelinin yorumu aşağıdakilerden hangisidir?
a) X’deki 1 birimlik değişme Y’yi % 0.61 arttırır.
b) X’deki 1 birimlik değişme ln Y’yi % 0.61 arttırır.
c) X’deki 1 birimlik değişme Y’yi % 61 arttırır.
d) X’deki % 1 birimlik değişme ln Y’yi % 0.61 arttırır.
e) Ln X’deki 1 birimlik değişme ln Y’yi % 0.61 arttırır.
5) Jarque-Bera istatistiği için aşağıdakilerden hangisi yanlıştır?
a) Test istatistiği 2 serbestlik derecesiyle ki-kare dağılımına uygundur.
b) Hata terimlerinin normal dağıldığı varsayımının testi amacıyla kullanılır.
c) Çarpıklık ve basıklık ölçülerine dayanmaktadır.
d) Test istatistiği momentlerden hesaplanır.
e) Temel hipoteze göre basıklık 3’e, çarpıklık 0’a eşittir.
6) ln ln lni i iY X u model için aşağıdakilerden hangisi yanlıştır?
a) EKK tahmincileri ile ile ’in doğrusal, sapmasız ve en iyi tahmin edicileridir.
201
b) ˆln sapmasız olduğu halde, logaritmik dönüşümü sapmalı ancak tutarlı bir
tahmindir.
c) X artarken Y azalarak artıyorsa parametresi 0’dan küçüktür.
d) Tahmin edilen parametre ( ) esnekliği verir.
e) Esneklik her noktada sabittir.
7) ln lni i iY X u modeli için aşağıdakilerden hangisi yanlıştır.
a) 0 ise marjinal etki artan oranda artmakta, 0 azalan oranda azalmaktadır.
b) X’deki bir birimlik değişme Y‘de yaklaşık % kadar bir değişime neden olur.
c) % lık değişme 100 ile çarpılırsa Y’nin büyüme oranı elde edilir.
d) Esneklik iY eşittir.
e) , Y’deki nisbi değişmenin X’deki mutlak değişmeye oranıdır.
8) Q üretimi göstermek üzere yıllık verilerden ln 5.112 0.062Q t tahmin edilen
modelde ln(1 ) 0.062r olup, 0.062’nin anti logu 1.064’e eşittir.
Aşağıdaki ifadelerden hangisi doğrudur?
a) Üretim yılda ortalama % 6.4 artmaktadır.
b) Üretim yılda ortalama % 62 artmaktadır.
c) Üretim yılda ortalama % 10.64 artmaktadır.
d) Üretim yılda ortalama % 6.2artmaktadır.
e) Üretim yılda ortalama % 106. 4 artmaktadır.
9) lni i iY X u modeli için aşağıdakilerden hangisi yanlıştır.
a) X>0 olmalıdır.
b) Marjinal etki her noktada değişmektedir.
c) >0 ise artan oranda azalmaktadır.
d) X’deki %1’lik değişme karşısında Y , kadar değişecektir.
e) <0 ise azalan oranda azalmaktadır
10) Aşağıdakilerden hangisi Jarque-Bera test istatistiğinin temel ve alternatif
hipotezlerdir? S= çarpıklık K=basıklık
a) H0: S=0 veya K=3 ; H1: S 0 veya K 3
b) H0: K=0 veya S=3 ; H1: K 0 veya KS 3
c) H0: S=0 veya K=3 ; H1: S 0 ve K 3
d) H0: S=0 veya K=3 ; H1: S 0 ve/veya K 3
e) H0: S=0 ve K=3 ; H1: S 0 ve/veya K 3
Cevaplar: 1.e), 2.a), 3.c), 4.a), 5.d), 6.c), 7.d), 8.a), 9.c), 10.e)
202
Bu Bölümde Ne Öğrendik Özeti
Doğrusal regresyon modeli her iktisadi ilişkiye uygunluk göstermez, dolayısıyla
alternatif model spesifikasyonlarının kullanılması gerekir. Bu bölümde alternatif modellerden
orjinden geçen regresyon, log-log model (tam logaritmik model) , log-doğrusal model, doğrusal
log modelin özelliklerini ele aldık. Bu modellerin özelliklerini inceledik. Özellikle log-log
model, log-doğrusal model, doğrusal log modelin parametrelerinin matematisel anlamı ve buna
bağlı olarak parametrelerin yorumları doğrusal modelden farklılık arz ettiğinin üzerinde
durduk.
Ayrıca hata teriminin normal dağıldığı varsayımı parametrelerin güven aralıklarının
oluşturulması ve hipotez testleri uygulamasında önem arz ettiği için, hata terimlerinin normallik
varsayımının testi için, JB testinin uygulamasını öğrendik.
203
Bölüm Soruları
1) ˆ 1.56 iY X şeklinde tahmin edilen regresyon modeli ile ilgili ara sonuçlar:
2
18627i iX Y 2 509iY
2 72iX olduğuna göre veriler uyumunu veren
ölçünün değeri aşağıdakilerden hangisidir?
a) 2 0.94r
b) 2 0.05r
c) 2 0.52ham r
d) 2 1.98ham r
e) Yukarıdaki veriler yetersizdir, hesaplanamaz.
2) Orijinden geçen regresyon modelini sabit parametreli regresyon modelinden
ayıran özelliklerden biri aşağıdakilerden hangisidir.
a) Sabit terimi istatistiksel açıdan anlamsızdır.
b) İktisadi bir zorunluluk yoksa orijinden geçen regresyon tercih edilmez.
c) Modelin parametrelerinin yorumu farklıdır.
d) Belirginlik katsayısı negatif çıkabilir.
e) Kalıntı kareler toplamı negatif çıkabilir.
3) “ X’deki %1’lik artış Y’yi % 0.02 düşürür” yorumu aşağıda tahmin sonuçları
verilen regresyon modellerinden hangisine aittir.
a) ˆln 0.81 2lnY X
b) ˆ 0.81 0.02Y X
c) ˆ 0.81 0.02lnY X
d) ˆln 0.81 0.0002lnY X
e) ˆln 0.81 0.02lnY X
204
4) S=4.307, K =6.721, n=34 ise aşağıdakiler den hangisi hata teriminin normal
dağılımının test istatistiğinin değeri ve kararıdır.
a) JB=82.504; 0H kabul; hata terimleri normal dağılıma uygundur.
b) JB=124.723; 1H kabul; hata terimleri normal dağılıma uygun değildir.
c) JB=21.084; 1H kabul; hata terimleri normal dağılıma uygun değildir.
d) JB=3.222; 0H kabul; hata terimleri normal dağılıma uygundur.
e) JB=0.06; 0H kabul; hata terimleri normal dağılıma uygun değildir.
5) Aşağıdakilerden hangisi yanlıştır?
a) Birinci moment 1’e, ikinci moment ortalamaya, üçüncü moment varyansa eşittir.
b) Çarpıklık ve basıklık ölçüleri momentlerden hesaplanır.
c) Momentler ölçü birimine bağlıdır.
d) Tahmin edilen modelin kalıntıları ile ilgili 2
iu , 3ˆiu ve
4
iu ’nın hesaplanmış
değerlerine sahip isek JB test istatistiğini hesaplayabiliriz.
e) JB test istatistiği 2 serbestlik dereceli ki-kare tablo değerinden büyük ise
kalıntılar normal dağılıma uygunluk göstermektedir.
6) Aşağıdakilerden hangisi doğrudur?
a) Log-log modelde esneklik sabittir.
b) Log –doğrusal modeller bağımlı değişkenin büyüme oranının tahminde
kullanılabilir.
c) Log-doğrusal modelde marjinal etki sabittir.
d) Doğrusal-log modelde esneklik bağımlı değişken Y’nin değerine bağlıdır.
e) Doğrusal-log modelde marjinal etki sabit değildir.
205
7) Y , GSYİH göstermek üzere yıllık verilerden ln 0.83 0.09Y t tahmin edilen
modelde ln(1 ) 0.09r olup, 0.09’nin anti logu 1.094’e eşittir. Aşağıdaki ifadelerden
hangisi doğrudur?
a) Büyüme oranı % 9
b) Büyüme oranı % 10.94
c) Büyüme oranı % 10
d) Büyüme oranı % 9.4
e) Büyüme oranı % 0.09
8) JB test istatistiği sonucuna göre aşağıdakilerden çıkarımlardan hangisi
yanlıştır.
a) Temel hipotez kabul edilirse, hata terimleri normal dağılır, bağımlı değişkenin de
normal dağıldığı sonucuna ulaşılır.
b) Temel hipotez kabul edilirse, hata terimleri normal dağılır tahmin edilen
parametrelerin de normal dağıldığı sonucuna ulaşılır.
c) Alternatif hipotez kabul edilirse, tahmin edilen parametrelerine uygulanan güven
aralıkları ve hipotez testleri geçersizdir.
d) Temel hipotez kabul edilirse, hata terimleri serisinin çarpıklığı 3, basıklığı 0’dır.
e) Klasik doğrusal regresyon modelinin normallik varsayımı isteğe bağlı varsayımdır,
ancak modelin geçerliliğinin testi için önemlidir.
9) Aşağıdakilerden hangisi doğrudur?
a) Alternatif modellerin seçiminde 2 ham r ile 2r karşılaştırılamaz.
b) Orijinden geçen regresyon modelinde sabit parametre olmadığı için 2 ham r
hesaplanır.
c) 2 ham r regresyon ile açıklanan değişmeden hesaplanır.
d) 2 ham r -1 ile 1 değerleri arasında yer alır.
e) Orijinden geçen modelinde 2 ham r ’nin hesaplanması isteğe bağlıdır.
206
10) Aşağıdakilerden hangisi yanlıştır?
a) Log-log model ile log-doğrusal model belirginlik katsayısına göre karşılaştırılamaz.
b) Log-log modelde bağımsız değişkenler sıfırdan büyük olmalıdır.
c) Doğrusal- log modelde bağımsız değişken sıfırdan büyük olmalıdır.
d) Log-log model ile Doğrusal- log model belirginlik katsayısına göre karşılaştırılamaz.
e) Log- doğrusal .modelde bağımsız değişken sıfırdan büyük olmalıdır.
Cevaplar
1) c
2) a
3) e
4) b
5) e
6) c
7) d
8) d
9) a
10) a
207
8. ÇOK DEĞİŞKENLİ REGRESYON MODELİ
208
Bu Bölümde Neler Öğreneceğiz?
8.1. Çok Değişkenli Regresyon Modeli
8.2. Çok Değişkenli Regresyon Modelinin Varsayımları
8.3. Çoklu Değişkenli Regresyon Modeli Parametrelerinin Tahmini: En Küçük Kareler
Yöntemi
8.4. Açıklayıcı Örnekler : İthalat Modeli
8.5. Hata Terimi Varyansının ( σ2 )Tahmini
8.6. Açıklayıcı Örnek: İthalat Modeli
209
Bölüm Hakkında İlgi Oluşturan Sorular
1) Bağımlı değişkeni etkileyen birden fazla bağımsız değişken varsa, ekonometrik
model nasıl tahmin edilir?
2) Bu modelin parametreleri nasıl yorumlanır?
210
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Çok Değişkenli Regresyon
Modeli ve Tahmini
Birden fazla bağımsız
değişkeni olan bir modelin
parametreleri nasıl tahmin
edileceği ve yorumlanacağı
Ders notları ve uygulamalar
tekrar edilerek
Esneklik Çok değişkenli regresyon
modellerinde esneklik
katsayılarının hesaplanması
ve yorumlanması
Ders notları ve uygulamalar
tekrar edilerek
211
Anahtar Kavramlar
Çok değişkenli regresyon modeli
Esneklik
hata teriminin varyans tahmini
Hata varyans tahmincisi
EKK tahmincisi
EKK tahmini
212
Giriş
Basit regresyon modelinin tahmini kolay olmasına karşın iktisadi ilişkilerin bazılarını
açıklamada yetersiz kalmaktadır. Çoğu iktisadi ilişkide bağımlı değişkeni etkileyen iki veya
daha fazla değişken vardır. Bu değişkenlerden bazıları model dışında bırakılır ve iktisadi
ilişkiler basit regresyon modeli ile tahmin edilirse, önemli değişkenler model dışında kalacak
ve model spesifikasyon hatalarından dışlanmış değişken durumda ortaya çıkan olumsuzluklara
maruz kalacaktır. Ekonometrik model mümkün olduğunca sade olmalıdır ancak modelde
bağımlı değişkeni etkileyen önemli bağımsız değişkenlere mutlaka yer verilmelidir. Bu
dersimizde birden fazla bağımsız değişkeni olan ve çok değişkenli regresyon modeli olarak
bilinen konuya giriş yapacak, çok değişkenli modelin parametrelerinin tahmini, yorumu ve hata
terimi varyansının tahminini ele alacağız. Ayrıca klasik doğrusal regresyon modelinin çok
değişkenli regresyon modeli için varsayımları kısaca ele alınacaktır.
Basit regresyon modelinde bağımlı değişken Y sadece bir bağımsız değişken X ile
ilişkili olduğu için model basit regresyon ile adlandırılır. Bu model pek çok durum için yararlı
olmasına karşın, çoğu iktisadi modelde bağımlı değişken Y’yi etkileyen iki veya daha fazla
bağımsız değişken etkilemektedir. Örneğin talep denkleminde, bir malın talep edilen miktarı,
bu malın fiyatına, ikame ve tamamlayıcı malların fiyatlarına ve gelire bağlıdır. Bir üretim
fonksiyonundaki çıktı, bir girdiden daha fazlasının bir fonksiyonudur. Toplam para talebi,
toplam gelir ve faiz oranın bir fonksiyonudur. Yatırım ise faiz oranı ve gelirdeki değişime
bağlıdır.
Birden fazla açıklayıcı değişkenli bir iktisadi modeli, buna uygun ekonometrik
modeline dönüştürüldüğünde bu model, çok değişkenli regresyon modeli (çoklu regresyon
modeli) olarak adlandırılmaktadır. Önceki bölümlerde basit regresyon modeli için
geliştirdiğimiz sonuçların çoğu, çok değişkenli regresyon modeli için genişletilebilir.
parametresinin yorumunda küçük değişiklikler söz konusudur, t-dağılımı için serbestlik
derecesi değişecektir ve açıklayıcı değişkenlerin ( X ) özellikleri ile ilgili varsayıma ilave
varsayıma ihtiyaç vardır. Çok değişkenli regresyon modelinin anlaşılabilmesi için basit
regresyon modelinin özümsenmiş olması gerekir.
213
8.1. Çok Değişkenli Regresyon Modeli
Daha önceki bölümde basit regresyon modeli ile reklam harcamalarının farklı
düzeylerinin satışlar üzerindeki ortalama etkisini tespit ettik. Firma reklam harcamalarının
farklı düzeylerinin yanı sıra farklı fiyat yapılarının da etkilerini değerlendirmek isteyebilir.
Firma reklam harcamalarının düzeyi değiştikçe, satış rakamlarının nasıl değişecek?
Reklam harcamasındaki bir artış, satışlarda bir artışa yol açar mı? Eğer bu mümkünse,
satışlardaki artış, artan reklam harcamasını savunmak için yeterli midir? Firma ayrıca, fiyatlama
stratejisi ile de ilgilidir. Düşen fiyatlar, satış hasılatında bir artışa mı yoksa bir azalışa mı yol
açmaktadır? Fiyattaki bir azalma, satılan miktarda yalnızca küçük bir artışa yol açıyorsa, satış
hasılatı azalır ( talep, düşük fiyat esnekliğine sahiptir); satılan miktarda büyük bir artışa yol
açan bir fiyat düşüşü, hasılatta bir artışı sağlayacaktır ( talep fiyata göre, esnektir). Bu iktisadi
bilgi, etkili yönetim için temeldir.
İlk adım, satış hasılatının bir veya daha fazla açıklayıcı değişkene bağlı olduğu bir
iktisadi model kurmaktır. Satış hasılatının (Y ) , fiyat ( 1X ) ve reklam harcaması ( 2X ) ile
doğrusal olarak ilişkili olduğunu hipotezi altında iktisadi model aşağıdaki gibidir:
0 1 1 2 2iY X X
Bu denklemde, Y aylık satış hasılatını temsil etmektedir, 1X fiyat ve 2X ise reklam
harcaması temsil etmektedir. Satış hasılatı (Y ) ve reklam harcamaları ( 1X ) bin lira, fiyat (
2X ) ise lira cinsinden ölçülmektedir. 0 1, ve 2 , satışların ( Y ) fiyat ( 1X ) ve reklam
harcamalarına ( 2X ) bağımlılığını gösteren, bilinmeyen parametreler. Matematiksel olarak
kesim (otonom) parametresi 0 , bağımsız değişkenler sıfır değerini aldığında bağımlı
değişkenin değeridir. Ancak basit regresyon bahsinde de belirtildiği gibi çoğu durumda kesim
parametresinin, açık bir iktisadi yorumu yoktur. Örneğin bu örnekte fiyatın ve reklam
harcamalarının sıfır olması ( 1 2 0X X ) durumu iktisadi açıdan gerçekçi değildir. Çok özel
durumlar haricinde, doğrudan bir iktisadi yorumu olmasa bile, her zamanda modele bir sabit
eklenir.
1 ’nin işareti pozitif veya negatif olabilir. Fiyattaki bir artış, satış hasılatında bir artışa
yol açıyorsa 1 0 olup, talebin fiyat esnekliği, esnek değildir. Aksine, fiyattaki bir artış,
satışlarda bir azalışa yol açıyorsa, talebin fiyat esnekliği, esnektir ve bu durumda, 1 0 olur.
Böylece, 1 ’nin işaret bilgisi, talebin fiyat esnekliği hakkında genel bilgi sağlar. 1 ’nin
büyüklüğü, veri bir fiyat değişimi karşısında, satış gelirlerindeki değişim miktarını ölçer. Diğer
taraftan reklam harcamalarının atışlar üzerindeki etkisini gösteren 2 ’in işaretinin pozitif
olmasını bekleriz, reklam çok kötü olmadıkça, reklam harcamasındaki bir artış satış hasılatında
bir artışa yol açacaktır. 2 1 ise reklam harcamasında 1,000 lira’lık bir artış, satış gelirlerinde
214
1,000 lira’ dan daha az bir artış sağlayacaktır. 2 1 ise daha fazla bir artış sağlayacaktır. Bu
sebeple, firmanın reklam politikası açısından, 2 bilgisi çok önemlidir.
0 1, ve 2 ‘den yukarıdaki bilgilere ulaşabilmenin yolu bu iktisadi modeli,
ekonometrik bir modele dönüştürmektir.
Yukarıdaki iktisadi model satışalar için beklenen veya ortalama davranışını
açıklamaktadır. Böylece, bu durumu
0 1 1 2 2i i iE Y X X
olarak yazabiliriz, burada , iE Y satış gelirlerinin “beklenen değeri” dir. Satış hasılatı, fiyat ve
reklam verileri, tam bir doğrusal ilişki izlemeyecektir.
Çok değişkenli bu model bir doğruyu göstermemekte, bir düzlemi göstermektedir.
Gözlemlenebilir satış geliri ile beklenen satış geliri değeri arasındaki fark, rassal hata
terimi ’dir i i iu Y E Y . Rassal hata, satış gelirinin, beklenen değerinden farklı olmasına yol
açan, fiyat ve reklam haricindeki tüm faktörleri temsil eder. Bu faktörler, hava koşullar,
rakiplerin davranışı, tüketici davranışındaki farklar olabilir. Hata terimini eklemek aşağıdaki
modeli sağlar,
0 1 1 2 2i i i iY E Y u X X u
İktisadi model, satış gelirleri ile fiyat ve reklam harcamaları ortalama sistematik ilişkiyi
açıklar. Beklenen değer iE Y rassal olmayan, sistematik bileşendir. Ancak satış gelirlerinin
beklenen değerine rassal hata eklendiği için satışlar da rassal bir değişkendir. Satış gelirinin
değerinin ne olacağı, gözlemleninceye kadar bilinmez.
Hata terimi ve dağılımı ile ilgili varsayımların kullanılmaya başlanması ile iktisadi
model, ekonometrik modele dönüşmektedir. Ekonometrik model, değişkenler arasındaki
ilişkilerin daha gerçekçi bir açıklamasını ve bunun yanısıra bilinmeyen parametrelerin
tahmincilerinin değelerlendirilmesi ve geliştirilmesi için bir çerçeve sağlamaktadır.
Çok değişkenli regresyon modelinde, bağımlı değişken Y, doğrusal denklem boyunca k-
1 sayıda bağımsız değişken (açıklayıcı değişken) 1 2 1, , , kX X X ile ilişkilidir. Çok değişkenli
regresyon modeli aşağıdaki gibi gösterilebilir.
0 1 1 2 2 1 1i i i k ik iY X X X u
215
1 2 1, , , k ; Y ile 1 2 1, , kX X X değişkenleri arasında ilişki kuran modelin
bilinmeyen parametreleridir. Parametrelerin yorumu basit regresyonda olduğundan küçük bir
farklılık göstermektedir. Örneğin 2 parametresi diğer değişkenler sabit tutulduğunda 2X
değişkenindeki bir birim değişimin, Y’nin beklenen değeri üzerindeki etkisini ölçer. 2 , kısmi
türev ile aşağıdaki gibi gösterilebilir.
2
2 2
( ) ( )E Y E Y
X X
1 3 1, , sabit tutulursakX X X
0 parametresi, kesim terimi (otonom parametre)’dir. Çok değişkenli regresyon
modelinin tahmini, çok değişkenli regresyon modellerinin en basiti olan iki bağımsız değişkenli
model çerçevesinde incelenecektir. İkiden fazla bağımsız değişkenli modellerin tahmini daha
fazla matematiksel işlemler gerektirdiği için Ekonometri Paket Programları ile yapılmaktadır.
İki bağımsız değişkenli çok değişkenli regresyon modeli aşağıdaki gibi gösterilebilir.
0 1 1 2 2i i i iY X X u
Yukarıda verilen modelde parametre sayısı (k) 3’ e eşittir. Bu parametreler için
uygulanacak nokta ve aralık tahminleri, daha fazla bağımsız değişkenli modeller (𝑘 > 3) için
de geçerlidir.
8.2. Çok Değişkenli Regresyon Modelinin Varsayımları
Çok değişkenli ekonometrik model için rassal hataların ui olasılık dağılımı ile ilgili
varsayımlar, basit regresyon modelindeki varsayımlara benzerdir. Bunlar,
1. ( ) 0iE u
Her alt ana kütle için rassal hata, sıfır ortalamalı bir olasılık dağılımına sahiptir.
Hataların bazıları pozitif, bazıları negatif olacaktır. Çok büyük gözlemler için, bunların
ortalamada sıfır olacağı beklenmektedir.
2. 2 2( )i iE u Var u
Her alt ana kütle için rassal hata, 2 varyanslı bir olasılık dağılımına sahiptir. Basit
regresyondan bilindiği üzere, varyans bilinmeyen bir parametredir ve modeldeki
belirsizliği ölçer. Rassal hatanın varyansı her bir gözlem için aynıdır. Böylece
herhangi bir gözlem için model belirsizliği daha fazla veya az değildir ve hata terimi
iktisadi değişkenle doğrudan ilişkili değildir. Bu özelliğe sahip hatalar, sabit
varyanslı (homoskedastik; eşit varyanslı) olarak isimlendirilir.
3. ( , ) 0i jCov u u İki farklı rassal hata arasındaki kovaryans sıfırdır. Bir gözlemin
hatasının büyüklüğü, diğer bir gözlemin hatasının olası büyüklüğünü etkilemez. Bu
sebeple, herhangi bir hata çifti korelasyonlu değildir. Bu varsayım sağlanmazsa
216
otokorelasyon olarak adlandırılan ve modelin aleyhine sonuçlar doğuran
ekonometrik bir problem söz konusu olur.
4. Rassal hataların iu , normal olasılık dağılımına sahiptir, 20,iu N .
Yine basit regresyondan bilindiği üzere bağımlı değişken Y’deki her bir gözlem, rassal
hata terimi iu ’ya bağlı olduğu için, Y’de rassal bir değişkendir. Y’nin istatistiksel özellikleri,
u’nun özelliklerinden elde edilir. Bu özellikler aşağıdaki gibidir:
5. Y’nin beklenen (koşullu ortalama) değeri 1 2 0 1 1 2 2,E Y X X X X , bağımsız
değişkenlerin ve bilinmeyen parametrelerin değerlerine bağlıdır. ( ) 0iE u olduğu
varsayımı, Y′ nin ortalama değerinin her bir gözlem için değişeceğini ve
0 1 1 2 2E Y X X regresyon fonksiyonu ile belirleneceği anlamına
gelmektedir.
6. 2( ) ( )i iVar Y Var u . Y’nin olasılık dağılımının varyansı her bir gözlem için
sabittir. Y’nin bazı gözlemleri, diğerlerine göre, regresyon fonksiyonundan daha
uzakta değildir. Y‘nin varyansı ile u’nun varyansı eşittir, ancak beklenen değerleri
farklıdır.
7. ( , ) ( , ) 0i j i jCov y y Cov u u .
Bağımlı değişkenin herhangi iki gözlemi korelasyonlu değildir. Örneğin, bir gözlem
E Y ’nin üzerindeyse ( pozitif ise), sonraki gözlem muhtemelen E Y ’nin altında
(negatif)’ dır.
8. Y ‘nin değerleri, ortalamaları etrafında normal dağılır 2
0 1 1 2 2 ,Y N X X .
Bu varsayım, 20,iu N varsayımına eşittir.
Çok değişkenli regresyon modeli için yukardaki hata terimi ( ve dolayısıyla bağımlı
değişken ) ile ilgili varsayımlara ek olarak, açıklayıcı değişken ile ilgili iki varsayım vardır.
Bunlardan ilki basit regresyondan bilinmekte, ancak ikincisi çok değişkenli regresyon modeline
özgü bir varsayımdır.
9. Bağımsız değişkenler rassal değildir. Bu varsayım göre bağımlı değişkenin değerleri
gözlemlenmeden önce, bağımsız değişkenin değerleri bilinmektedir.
10. Bağımsız değişkenlerden herhangi biri, diğerlerinin tam doğrusal bir fonksiyonu
değildir. Bu varsayım, hiçbir değişkenin gereksiz olmadığı varsayımına eşdeğerdir.
Göreceğimiz gibi, bu varsayım sağlanamazsa, -tam doğrusal bağlantı olarak
isimlendirilen bir durum- en küçük kareler yöntemi başarısız olur.
217
8.3. Çoklu Değişkenli Regresyon Modeli Parametrelerinin Tahmini:
En Küçük Kareler Yöntemi
Bu bölümde, çok değişkenli regresyon modelinin bilinmeyen parametrelerinin tahmini
için en küçük kareler ilkesinin kullanımı ele alınacaktır. Çok değişkenli regresyon modelinin
en basiti aşağıda verilen iki bağımsız değişkene sahip modeldir.
0 1 1 2 2i i i iY X X u
Ekonometrik modelin bilinmeyen parametrelerinin tahmini için, bir tahminci olarak en
küçük kareler yöntemini kullanılacaktır. Basit regresyondan bilindiği üzere EKK ilkesi ile iY
’nin gözlemlenen değerleri ( iY ) ile beklenen değerleri 0 1 1 2 2i i iE Y X X arasındaki
farkların kareli toplamını minimize eden 0 1, ve 2 değerlerinin bulunmasına
dayanmaktadır. Bu amaçla örnek verilerinden hareket edilir ve örnek regresyon modeli
aşağıdaki gibi yazılır.
0 1 1 2 2ˆ ˆ ˆˆ ˆ ˆ
i i i i i iY Y u X X u
i. gözlem için iY ’nin değeri ˆiY ve ˆiu
’ye bağlıdır. EKK yöntemi ile bilinmeyen
parametrelerin tahmini için yine bilinmeyen paremetrelerin bir fonksiyonu olan kalıntı kareler
toplamı fonksiyonunun minimize edilmesi gerekir. Kalıntı kareler toplamı fonksiyonunun(2ˆiu
) minimizasyonu için, fonksiyonda 0 1ˆ ˆ, ve 2 ’ye göre kısmi türev alınarak sıfıra eşitlenir.
2
0
ˆ0
ˆiu
, 2
1
ˆ0
ˆiu
, 2
2
ˆ0
ˆiu
Gerekli matematiksel işlemler ve sadeleştirmeler yapılırsa, aşağıdaki denklem sistemi elde
edilir.
0 1 1 2 2ˆ ˆ ˆ
i i iY n X X
2
1 0 1 1 1 2 1 2ˆ ˆ ˆ
i i i i i iY X X X X X Normal Denklemler
2
2 0 2 1 1 2 2 2ˆ ˆ ˆ
i i i i i iY X X X X X
Yukarıdaki denklem sistemi, üç bilinmeyenli üç denklemden oluşmakta ve EKK’in
normal denklemleri adını almaktadır. Denklemler eş anlı çözümlendiğinde modelin
bilinmeyenleri 0 1ˆ ˆ, ve 2 hesaplanır. Normal denklemlerde yer alan unsurlar değişkenlerin
gözlemlenen değerleridir. Orijin 0 noktası olup değişkenlerin 0’a uzaklığı hesaplamalara
katılmıştır.
218
Ancak bu normal denklemlerin çözümü oldukça fazla zaman alır. Bundan dolayı üç
değişkenli regresyon modelinin EKK tahmini için değişkenlerin ortalamadan farkları (
1 1 1 2 2 2, ,i i i i i iY Y y X X x X X x ) kullanılacaktır.
Öncelikle normal denklemlerden birincisinin
0 1 1 2 2ˆ ˆ ˆ
i i iY n X X
her iki yanı n gözlem sayısına bölünür ve
0 1 1 2 2ˆ ˆ ˆY X X
sonucuna ulaşılır. Daha sonraki aşamada i.gözlem için ˆiY ile Y arasındaki fark alınır. EKK
yönteminin özelliklerinden Y Y , çok değişkenli regresyon içinde geçerlidir.
0 1 1 2 2 0 1 1 2 2ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ
i i i iY Y Y Y X X X X
Yukarıda 0 sadeleşir ve gerekli kısaltma yapılırsa
1 1 1 2 2 2ˆ ˆˆ
i i iY Y X X X X ’dan
1 1 2 2ˆ ˆˆ
i i iy x x
sonucuna ulaşılır ki; bu gösterim ortalamadan farklara göre örnek regresyon fonksiyonudur.
Daha önce ˆ ˆi i iY Y u eşitliğinin, değişkenlerin ortalamalarında farklarıyla ˆ ˆ
i i iy y u ile
gösterilebileceği bilinmektedir. Buna göre;
i. gözlem için
ˆ ˆi i iy y u ’den
1 1 2 2ˆ ˆˆ ˆ
i i i i i iu y y y x x
olarak yeniden yazılabilir. i=1…..n’e kadar her iki tarafın kareler toplamı alınır ve hata terimi
kalıntı kareler toplamı fonksiyonunda 1 ve 2 ’e göre kısmi türev alınarak sıfıra eşitlenir.
2
2
1 1 2 2ˆ ˆˆ
i i i iu y x x
2
1
ˆ0
ˆiu
, 2
2
ˆ0
ˆiu
219
Kısmi türevlerin sıfıra eşitlenip çözümlenmesinden aşağıdaki denklem sistemi elde edilir.
2
1 1 1 2 1 2ˆ ˆ
i i i i ix y x x x
2
2 1 1 2 2 2ˆ ˆ
i i i i ix y x x x
Yukarıdaki denklem sistemine Cramer kuralı uygulanarak 1 ve 2 hesaplanır.
2
1 2 2 1 2
1 22 2
1 2 1 2
ˆ i i i i i i i
i i i i
x y x x y x x
x x x x
2
1 1 2 2 1
2 22 2
1 2 1 2
ˆ i i i i i i i
i i i i
x y x x x y x
x x x x
0 ise, 0 1 1 2 2ˆ ˆ ˆY X X eşitliğinden hesaplanır.
Basit doğrusal regresyon modeli uzayda bir doğru belirlerken, çok değişkenli regresyon
modelleri bir düzlem belirlediğini bir kez daha hatırlatalım.
En küçük kareler ilkesini, en küçük kareler tahmincileri ve en küçük kareler tahminleri
arasındaki farkı anlamak önemlidir. Örnek verileri kullanılarak kalıntıların karelerinin toplamı
fonksiyonu minimize edilerek elde edilen 0 1ˆ ˆ, ve 2 için formüller, bilinmeyen
parametrelerin en küçük kareler tahmincileri olarak isimlendirilen tahmin yöntemleridir.
Genelde, bunların değerleri, veriler gözlemlenene kadar ve tahminler hesaplanana kadar
bilinmediği için, en küçük kareler tahmincileri de rassal değişkenlerdir. En küçük kareler
tahminleri ise sayısal değerlerdir.
8.4. Açıklayıcı Örnekler : İthalat Modeli
Aşağıdaki tabloda ithalat, GSMH ve ithal malları fiyat endeksi verileri yer almaktadır.
1986-1989 dönemi için ithalat denklemi EKK yöntemi ile tahmin edilecektir. Not: Bu
uygulamada 3 parametre tahmin edilmekte, ancak 4 gözlem kullanılmaktadır. Bu durum
ekonometrik uygulama için uygun değildir, daha fazla sayıda gözlemin olması gereklidir.
Ancak buradaki amaç EKK tahminlerinin nasıl elde edildiğini göstermek olduğu için,
matematiksel işlemlerde basitlik olması açısından gözlem sayısı sınırlı tutulmuştur.
Yıllar İthalat (Milyar Lira)
Y
GSMH (Milyar Lira)
X1
İthal Malları Fiyat
Endeksi X2
1986 1 10 2
1987 3 12 1
1988 5 16 2
220
1989 7 22 3
İthalat denklemi 0 1 1 2 2ˆ ˆ ˆˆ
i i iY X X ’de yer alan 0 1ˆ ˆ, ve 2 için EKK
tahmincileri aşağıdaki gibidir.
2
1 2 2 1 2
1 22 2
1 2 1 2
ˆ i i i i i i i
i i i i
x y x x y x x
x x x x
2
1 1 2 2 1
2 22 2
1 2 1 2
ˆ i i i i i i i
i i i i
x y x x x y x
x x x x
0 1 1 2 2ˆ ˆ ˆY X X
Burada 1 1 1 2 2 2, ,i i i i i iY Y y X X x X X x ’dir . Öncelikle EKK
tahmincilerinde yer alan aşağıdaki unsurların hesaplanması gerekir.
1 1 1i i i iy x Y X nX Y 2 2
iiy Y nY
2 2 2i i i iy x Y X nX Y 2 2 2
1 1 1i ix X nX
1 2 1 2 1 2i i i ix x X X nX X 2 2 2
2 2 2i ix X nX
Yıllar Y X1 X2 Y2 2
1X 2
2X 1YX
2YX 1 2X X
1986 1 10 2 1 100 4 10 2 20
1987 3 12 1 9 144 1 36 3 12
1988 5 16 2 25 256 4 80 10 32
1989 7 22 3 49 484 9 154 21 66
16iY
4Y
1 60iX
1 15X
2 8iX
2 2X
2
iY
84
2
1X
984
2
2X
18
1iY X
280
2YX
36
1 2X X
130
221
1 1 1
2 2 2
2 22
22 2 2
1 1 1
22 2 2
2 2 2
1 2 1 2 1 2
280 4 15 4 40
36 4 2 4 20
84 4 4 20
984 4 15 84
18 4 2 2
130 4 15 2 10
i i i i
i i i i
ii
i i
i i
i i i i
y x Y X nX Y
y x Y X nX Y
y Y nY
x X nX
x X nX
x x X X nX X
1 2
40 2 4 10ˆ 0.5884 2 10
2 2
40 10 4 84ˆ 0.9484 2 10
0ˆ 4 0.58 15 0.94 2 2.9412
1 2ˆ 2.94 0.58 0.94iY X X
İthalat malları fiyat indeksi sabit iken, GSMH’daki 1 milyar liralık artış, ithalatı
ortalama olarak 0.58 milyar lira arttıracaktır. GSMH sabit iken, ithal malları fiyat indeksindeki
1 br’lik artış ithalatı 0.94 milyar lira azaltır. GSMH ve ithalat fiyat indeksi dışındaki
değişkenlerin ithalat üzerindeki ortalama etkisi -2.94 milyar liradır.
İthalatın gelir ve fiyata göre ortalama esnekliği aşağıdaki gibi hesaplanır.
1
1 11
1
15ˆ (0.58) 2.1754
YX
Y X X
X Y Y
2
2 22
2
2ˆ ( 0.94) 0.474
YX
Y X X
X Y Y
GSMH’daki %1’lik artış, ithalatı ortalama olarak % 2.2 arttırmaktadır. Fiyatlardaki %1’lik
artış, ithalatı ortalama olarak % .47 azaltmaktadır.
Bu aşamada X1=16 ve X2=2 olduğu noktada ithalatın gelir ve fiyata için elastikiyetini
hesaplayarak yorumlayalım.
Öncelikle X1=16 ve X2=2 olduğu noktada ithalatın tahmini değerini bulmamız gerekir.
1 2ˆ 2.94 0.58 0.94 2.94 0.58 16 0.94 2 4.46iY X X
X1=16 olduğu noktada ithalatın gelir esnekliği
222
1
1 11
1
14 14ˆ (0.58) 1.82ˆ ˆ 4.46
iYX
Y X X
X Y Y
X2=2 olduğu noktada ithalatın fiyat esnekliği
2
2 22
2
2 2ˆ ( 0.94)ˆ ˆ 4
..
26
44
0iYX
Y X X
X Y Y
Bu sonuca göre X1=16 ve X2=2 olduğu noktada ithalat gelire göre esnek değil, fiyata
göre esnektir.
8.5. Hata Terimi Varyansının ( 𝛔𝟐 )Tahmini
Çok değişkenli regresyon modelinde, modelin parametreleri 0 1 2 1, , , , k ’nın
tahminlerinden sonra tahmin edilmesi gereken bir diğer parametre de hata terimi varyansıdır.
2 2( ) ( )i iVar u E u
Hata terimi varyansını ( 2 ), kareli hataların (2
iu ) beklenen değeri veya anakütle
ortalaması olarak düşünebiliriz. Ancak kareli hatalar (2
iu ) gözlemlenemez. Bu nedenle 2 için
EKK kalıntılarının karelerine dayanan bir tahminci geliştirilir. 0 1 1 2 2ˆ ˆ ˆˆ
i i iY X X için, bu
kalıntılar aşağıdaki gibidir:
0 1 1 2 2ˆ ˆ ˆˆˆ
i i i i i iu Y Y Y X X
2 ’nin iu ’deki değişkenliği veya eşdeğer olarak, Yi’nin ortalama fonksiyon
0 1 1 2 2i iX X etrafında değişkenliği ölçmesi nedeniyle ˆiu de 2 ile ilgili bilgi
sağlayacaktır.2ˆiu ’den elde edilen bu bilgiyi kullanan ve istatistiksel açıdan iyi özellikleri sahip
olan 2 için bir tahminci aşağıdaki gibidir:
2
2 1
ˆ
ˆ
n
i
i
u
n k
Burada k, çok değişkenli regresyon modelinde tahmin edilen parametre sayısıdır. 2 ,
ortalama işlemindeki n yerine n-k olan payda ile 2ˆiu ‘nın bir ortalaması olarak düşünülebilir.
2 sapmasız olması için, 2
iu ’yi, 2ˆiu ile yer değiştirmek, n yerine n-k ’nin kullanılmasını
gerektirir.
ˆiu , iu ’in tahminleri olduğu için, ˆiu ’nın büyük değerleri,’ 2 nin büyük olduğu
anlamına gelmektedir. Diğer yandan ˆiu ’nın küçük değerleri, 2 ’nin küçük olduğunu ifade
etmektedir. ˆiu ’nın “büyük” değerleri, büyük pozitif ve büyük negatif değerler anlamındadır.
223
Kalıntı karelerini2ˆiu ’yi kullanmanın amacı pozitif değerlerin
2ˆiu negatif değerleri yok etmesini
önlemektir, böylece, kalıntı kareler toplamı (2ˆiu ) , 2 ile ilgili bilgi sağlamaktadır.
8.6. Açıklayıcı Örnek: İthalat Modeli
Yukarıda verilen ithalat örneğimiz için ana kütle hata teriminin varyansını tahmin
edelim.
1 2ˆ 2.82 0.58 0.94iY X X
Hata teriminin veryansının tahmincisi aşağıdaki gibidir.
2
2 1
ˆ
ˆ
n
i
i
u
n k
n=gözlem sayısı, k=parametre saıyısı
Burada n=4 k=3 olduğu bilinmekte, ancak 2
1
ˆn
i
i
u
bilinmemektedir. ˆˆi iu Y Y
eşitliğinden kalıntılar karelerinin toplamı aşağıdaki gibi hesaplanır.
iY ˆiY
ˆi i iu Y Y
2ˆiu
1 1.1 -0.1 0.01
3 3.2 -0.2 0.04
5 4.58 0.42 0.1764
7 7.12 -0.12 0.0144
2ˆ 0.2408iu
42
2 1
ˆ0.2408
ˆ 0.24084 3
i
i
u
n k
İthalat modeli için rassal hatanın varyansı 0.2408 tahmin edilmiştir. Buradan tahminin
standart hatası: 2ˆ ˆ 0.2408 0.4907 ’dir
224
Uygulamalar
Gözlem Üretim
(bin adet)
Çalışma saati
(100 saat)
Sermaye
(milyon lira)
1 11 10 25
2 10 7 22
3 12 10 30
4 6 5 18
5 10 8 21
6 7 8 15
7 9 6 17
8 10 7 12
9 11 9 14
10 10 10 24
Yukarıdaki verileri kullanarak 1-4 arası soruları cevaplandırınız.
1) Regresyon denklemini tahmin ediniz.
Yukarıdaki veriler üretim modeline aittir. Üretim(Q) emek (L) ve sermayenin (S)
fonksiyonu olduğuna göre üretim modeli için aşağıdaki regresyon denklemini tahmin edeceğiz.
0 1 2ˆ ˆ ˆQ L K
Q ; Y, L; X1 ve K ; X2 ile gösterilirse öncelikle aşağıdaki denklem sisteminin çözümü ile 1
ve 2 ’nin tahmin edilmesi gerekir.
2
1 1 1 2 1 2ˆ ˆ
i i i i ix y x x x
2
2 1 1 2 2 2ˆ ˆ
i i i i ix y x x x
Dikkat edilirse denklemlerdeki değişkenler ortalamalarından farkları ile gösterilmiştir.
Dolayısıyla ara sonuçların aşağıdaki gibi hesaplanması gerekir.
1 1 1
2 2 2
2 22
22 2 2
1 1 1
22 2 2
2 2 2
1 2 1 2 1 2
789 10 8 9.6 21
1945 10 19.8 9.6 44.2
952 10 9.6 30.4
668 10 8 28
4204 10 19.8 283.6
1634 10 8
i i i i
i i i i
ii
i i
i i
i i i i
y x Y X nX Y
y x Y X nX Y
y Y nY
x X nX
x X nX
x x X X nX X
19.8 50
225
Y
X1 X2 YX1 YX2 X1X2 Y2
X12 X1
2 X1 X22
11 10 25 110 275 250 121 100 625
10 7 22 70 220 154 100 49 484
12 10 30 120 360 300 144 100 900
6 5 18 30 108 90 36 25 324
10 8 21 80 210 168 100 64 441
7 8 15 56 105 120 49 64 225
9 6 17 54 153 102 81 36 289
10 7 12 70 120 84 100 49 144
11 9 14 99 154 126 121 81 196
10 10 24 100 240 240 100 100 576
96 80 198 789 1945 1634 952 668 4204
9.6 8 19.8
2
1 2 2 1 2
1 22 2
1 2 1 2
20.688
ˆ
21 283.6 44.2 50
28 283.6 50428
i i i i i i i
i i i i
x y x x y x x
x x x x
2
1 1 2 2 1
2 22 2
1 2 1 2
20.03
ˆ
(21 50) (44.2 28)
28 283.4
6 54 8
0
i i i i i i i
i i i i
x y x x x y x
x x x x
0 1 1 2 2
0.68842
ˆ ˆ ˆ
9.6 8 19.88 0.03448 4.775283
Y X X
Böylece doğrusal üretim fonksiyonunun tahmini aşağıdaki gibidir.
ˆ 4.775283 0.688428 0.03448Q L K
2) Tahmin ettiğiniz regresyon modelini yorumlayınız.
Sermaye sabitken çalışma saati 100 saat artarsa üretim 688.428 adet artacaktır. Çalışma
saati sabitken sermaye 1 milyon lira artarsa üretim 34.48 adet azalacaktır. Emek ve sermaye
sıfır iken üretim 4775.283 adettir (Not: emek ve sermaye olmaksızın üretimin gerçekleşmesi
olası değildir, aslında kesim parametresinin yorumlanmaması gerekir.)
226
3) Hata teriminin varyansını tahmin ediniz.
Hata terimi varyansının tahmin edicisi
2
2ˆ
ˆiu
n k
’dır.
Hata teriminin varyansının tahmin edilebilmesi için kalıntı kareler toplamının hesaplanması
gerekir. Daha önceki derslerimizden hatırlanacağı üzere kalıntı kareler toplamını hesaplamak
için;
- Tahmin edilen regresyon modelinde sırasıyla her gözlem için (i =1,2,…,10) emek ve
sermayenin değerleri yazılarak üretimin tahmini değeri hesaplanır ( ˆiQ ) .
- Bağımlı değişken üretimin gözlemlenen değerlerinden ( iQ ) tahmini değerleri( ˆiQ )
çıkarılarak kalıntılar ( ˆiu ) hesaplanır ( ˆ ˆi ii Q Qu ).
- i =1,2,…,10 ‘a kadar hesaplanan kalıntıların kareleri (2ˆiu ) hesaplanır.
- i =1,2,…,10 ‘a kadar hesaplanan kalıntıların karelerinin toplamı alınır.
Bu uygulama için kalıntıların karelerinin toplamı 2ˆ 14.41898iu hesaplanmıştır. Gözlem
sayısı 10, tahmin edilen parametre sayısı 3’ eşit olduğuna göre, hata teriminin varyansı
aşağıdaki gibidir.
2
2ˆ 14.41898
ˆ10
2.053
9854iu
n k
4) Emeğin ve kapitalin ortalamaya esnekliğini hesaplayarak yorumlayınız.
1 0.68ˆ ( 88428 0)
9.6.57369QL
Q L L
L Q Q
2 0.03419.8ˆ ( )9.6
48 0.07112QK
Q K K
K Q Q
Bu sonuçlara göre emek %1 artarsa üretim yaklaşık olarak ortalama % 0.57 artar. 0.57
aynı zamanda emeğin marjinal verimliliğidir. Sermaye %1 aratarsa üretim yaklaşık ortalama %
0.07 azalır. -0.07 sermayenin marjinal verimliliğidir.
227
5) Emeğin 8 birim sermayenin 15 birim olduğu noktada emek ve sermayenin
esnekliği hesaplayarak yorumlayınız.
Öncelikle emeğin 8 birim sermayenin 15 birim olduğu noktada üretimin tahmini değeri
hesaplanır.
ˆ 4.775283 0.688428 8 0.03448 15 9.765505Q
1 0.688428 0.5639679.76550ˆ 5
8ˆ ( )ˆ
i iQL
L LQ
L Q Q
2 0.0315ˆ ( )
ˆ ˆ448 0.05296
9.765505
i iQK
K KQ
K Q Q
Emeğin 8 birim sermayenin 15 birim olduğu noktada, emekteki %1 lik artış üretim
miktarını yaklaşık % 0.56 arttırırken sermayedeki %1’lik artış üretim miktarını yaklaşık %
0.05 düşürür.
6) Yukarıdaki doğrusal üretim modelin dezavantajları nelerdir? Nasıl bir çözüm
önerirsiniz?
Yukarıda tahmin edilen fonksiyon doğrusal olduğu için sadece tek bir üretim faktörü ile
üretim geçekleşebilir. Çünkü üretim faktörleri birbirleri ile toplanır durumdadır. Ancak iktisadi
açıdan değerlendirildiğinde her iki üretim faktörünün de belli bir oranda kullanılması gerekir.
Ayrıca bu modelde üretim faktörler emek ve sermayenin üretim üzerindeki etkileri sabittir.
Hâlbuki iktisat teorisine göre üretim faktörlerinin artışı bir noktaya kadar üretimi arttırır, ancak
daha sonra bu artış azalarak devam eder. Modelin fonksiyonel biçiminin değiştirilmesi gerekir.
Uygun model 1 2
0
uQ L K e ’nın dönüştürülmüş biçimi log-log modeldir.
7) Modeli yeniden alternatif bir fonksiyonel biçim log-log model ile tahmin
edelim. Log-log model yukarıda verilen üretim fonksiyonundaki değişkenlerin doğal
logaritmalarının yer aldığı model olup, aşağıda verilmiştir.
0 1 2ln lnlnQ Ln L K u
Modelin tahmini için öncelikle değişkenlerin doğal logaritması alınmak suretiyle
dönüştürülmesi gerekir. Veri tablosu aşağıdaki gibi yeniden düzenlenir.
228
Q L K lnQ lnL lnK
11 10 25 2.3978 2.3025 3.2188
10 7 22 2.3025 1.9459 3.0910
12 10 30 2.4849 2.3025 3.4011
6 5 18 1.7917 1.6094 2.8903
10 8 21 2.3025 2.0794 3.0445
7 8 15 1.9459 2.0794 2.7080
9 6 17 2.1972 1.7917 2.8332
10 7 12 2.3025 1.9459 2.4849
11 9 14 2.3978 2.1972 2.6390
10 10 24 2.3025 2.3025 3.1780
Kısaca lnQ , *Y ile; ln L , *
1X ile; ln K , *
2X ile ve 0ln , *
0 ile gösterilirse aşağıdaki
modeli yazar ve EKK ile tahmin ederiz
* * * *
0 1 1 2 2ˆ ˆ ˆˆ
i i iY X X
Yukarıda verilen regresyon denklemi aynen 1. sorudaki gibi tahmin edilir. Tek fark
kullanılan verilerdir. EKK tahmincilerinde logaritması alınarak dönüştürülmüş veriler yer alır.
Burada aynı işlemleri tekrarlamak için sadece sonuç verilecektir. (Not: Okuyucunun modeli
çözmesi tavsiye edilir)
* * *
1 2ˆ 0.815073 0.642258 0.036365i i iY X X
Veya
0.815073 0.642258ln 0.036365lnlnQ L K
8) Tahmin edilen modelin parametrelerini yorumlayınız.
Yukarıdaki model log-log model olduğuna göre doğrusal modelden farklı olarak tahmin
edilen parametreler direkt esnekliği verecektir. Parametrelerin yorumu sırasıyla sermaye sabit
iken emekteki %1 lik değişim üretimi yaklaşık % 0.64, emek sabit iken sermayedeki %1’lik
değişme ise üretimi yaklaşık % 0.04 arttıracaktır.
9) Hata terimi varyansını tahmin ediniz.
10) Yeni modelin kalıntı kareler toplamı 0.195651 ‘e eşit hesaplanmıştır. Böylece hata
terimi varyansının tahmini
2
2ˆ 0.195651
ˆ10
0.027953
iu
n k
olarak hesaplanır.
229
11) İki model arasında tercih yapmak isteseniz hangisini tercih ederdiniz?
Ekonometrik açıdan hangi modelin tercih edilemesi gerektiği hususunda henüz
yeterince veri yok, testlerimizi henüz yapmadık, ancak iktisadi açıdan değerlendirildiğinde log-
log modelin tercih edilmesi daha uygundur.
230
Uygulama Soruları
231
Bu Bölümde Ne Öğrendik Özeti
Çok değişkenli regresyon modelinin temel varsayımlarını kısaca ele aldık. Çok
değişkenli regresyon modelinin EKK ile tahminini, tahmin edilen parametrelerin yorumunu ve
hata terimi varyansının tahmini gördük. Konuya mümkün olduğunca çok örnek vererek ve
bunları tahmin ederek, konu pekiştirilmeye çalışılmıştır. Okuyucuya çok değişkenli regresyon
başlığı altında ele alınan konular iyice kavranmadan bir sonraki alt başlığa geçilmemesi tavsiye
edilir
232
Bölüm Soruları
Y X1 X2
1 0 1
2 1 -2
3 2 1
-1 -2 0
0 1 -1
-1 -2 -1
2 0 1
1 -1 1
2 1 0
1-5 arası sorular için yukarıdaki verileri kullanılacaktır.
1) Regresyon denklemini tahmini aşağıdakilerden hangisidir.
a) 1 2ˆ 1.2 0.4 0.2iY X X
b) 1 2ˆ 0.7 0.25 1.6iY X X
c) 1 2ˆ 1 0.8125 0.4iY X X
d) 1 2ˆ 2.2 0.5719 1.062iY X X
e) 1 2ˆ 0.1 0.925 0.24iY X X
2) Tahmin ettiğiniz modelin parametrelerini yorumu aşağıdakilerden hangisidir.
a) 2X sabit iken 1X 1 birim değişirse, Y 0.4 birim artar. 1X sabit iken 2X 1 birim
değişirse, Y 0.2 birim azalır. 1 2 0X X iken, Y 1.2 birimdir.
b) 2X sabit iken 1X 1 birim değişirse, Y 0.25 birim artar. 1X sabit iken 2X 1 birim
değişirse, Y 1.6 birim artar. 1 2 0X X iken, Y 0.7 birimdir.
c) 2X sabit iken 1X 1 birim değişirse, Y 0.8125birim artar. 1X sabit iken 2X 1 birim
değişirse, Y 0.4 birim artar. 1 2 0X X iken, Y 1 birimdir.
d) 2X sabit iken 1X , 1 birim değişirse, Y 0.5719 birim artar. 1X sabit iken 2X 1 birim
değişirse, Y 1.062 birim artar. 1 2 0X X iken, Y 2.2 birimdir.
e) 2X sabit iken 1X , 1 birim değişirse, Y 0.925 birim artar. 1X sabit iken 2X 1 birim
değişirse, Y 0.24 birim artar. 1 2 0X X iken, Y 0.1 birimdir.
233
3) Kalıntı kareler toplamını hesaplayınız.
a) 3.8375
b) 0.2971
c) 2.0671
d) 1.8410
e) 0.9163
4) Hata terimi varyansını tahmin ediniz.
a) 1.73021
b) 0.93659
c) 3.81036
d) 0.13329
e) 2.04580
5) Yukarıdaki veriler kullanılarak tahmin edilen log-log modelin aşağıdakilerden
hangisidir?
a) 1 2ˆln 0.2 1.4ln 2.2lniY X X
b) 1 2ˆln 0.8 0.4ln 0.6lniY X X
c) log- log modelin tahmin edilebilmesi için 1 0X ve 2 0X olmalıdır. Bu uygulamada
1X ve 2X değişkenlerin sıfır değerini aldığı gözlemler vardır, dolayısıyla logaritması
alınamadığı için log-log model tahmin edilemez.
d) 1 2ˆln 3.2 0.9ln 1.5lniY X X
e) 1 2ˆln 2.65 1.062ln 2.945lniY X X
6-10 arası sorular için aşağıda verilen tabloda yer alan veriler kullanılacaktır.
Gözlem Talep Fiyat Gelir
1 14 2 200
2 11 3 200
3 15 1.5 180
4 20 0.5 350
5 22 0.4 360
6 18 2.8 250
7 16 1.3 160
8 10 3.5 220
9 9 5 180
10 14 2.2 220
6) Regresyon modelinin tahmini aşağıdakilerden hangisidir?
a) 1 2ˆ 13.495 1.908 0.024iY X X
b) 1 2ˆ 0.405 2.181 1.23iY X X
234
c) 1 2ˆ 0.527 0.603 1.521iY X X
d) 1 2ˆ 2.09 1.896 2.702iY X X
e) 1 2ˆ 0.256 1.335 0.724iY X X
7) Kalıntı kareler toplamı kaçtır?
a) 25.293
b) 18.74
c) 0.961
d) 1.862
e) 5.903
8) Hata tarimi varyansının tahmini aşağıdakilerden hangisidir?
a) 6.028
b) 4.022
c) 5.625
d) 8.145
e) 3.613
9) Aşağıdaki ifadelerden hangisi yanlıştır?
a) Çok değişkenli regresyon modeli uzayda bir düzlem belirler.
b) Çok değişkenli regresyon modelinde yer alan bağımsız değişkenler arasında doğrusal
bağlantı olmamalıdır.
c) Kalıntıların toplamı sıfırdan farklı çıkabilir.
d) Çok değişkenli regresyon modelinde serbestlik derecesi n-k’dır. n=gözlem sayısı , k=
parametre sayısı.
e) Çok değişkenli regresyon modellerinde hata terimin koşullu varyansı ile bağımlı
değişkenin koşullu varyansı eşittir.
10) Aşağıdakilerden hangisi çok değişkenli regresyon modelinin temel
varsayımlarından biri değildir?
a) Hata teriminin varyansı sabittir.
b) Bağımsız değişkenler arasında doğrusal bir ilişki yoktur.
c) Hata terimleri gözlemler itibariyle birbirleriyle ilişkisizdir.
d) Bağımsız değişkenlerin varyansları sıfırdan büyüktür.
e) EKK yöntemi ile tahmin edilmelidir.
Cevaplar
1) c
2) c
3)a
235
4)d
5)c
6)a
7)a
8)e
9)c
10)e
236
9. ÇOK DEĞİŞKENLİ REGRESYON MODELİNDE ARALIK TAHMİNİ
VE HİPOTEZ TESTİ
237
Bu Bölümde Neler Öğreneceğiz?
9.1. En Küçük Kareler Tahmincilerinin Örnekleme Özellikleri
9.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları
9.3. Açıklayıcı Örnek: İthalat Modeli
9.4. En Küçük Kareler Tahmincilerinin Dağılımı
9.4.1. Aralık Tahmini
9.4.2. Hipotez Testi
9.5. Uyumun İyiliğinin Ölçülmesi: Belirginlik Katsayısı
238
Bölüm Hakkında İlgi Oluşturan Sorular
1) Çok değişkenli regresyon modeli tahmincilerinin varyans ve kovaryansları nasıl
hesaplanır?
2) Çok değişkenli regresyon modeliden tahmin edilen parametrelerin güven aralıkları
ve hipotez testlari uygulaması nasıl olur?
3) Çok değişkenli regesyon modelinde uyumun iyiliğinin ölçüsü belirginlik katsayısı
nasıl hesaplanır?
239
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde edileceği
veya geliştirileceği
Aralık Tahmini ve
Hipotez Testi
Çok değişkenli regresyon
modelinde parametreler için
aralık tahminleri
oluşturulabilmek ve çift
taraflı hipotez kurabilmek ve
uygulanabilmek
Ders notları,
İstatistik kitapları
Ekonometri kitapları
Uygulamaların tekrar edilmesi
Belirginlik Katsayısı Çok değişkenli regresyon
modelinin verilere uyumu
hakkında bilgi edinmek
Ders notları
Uygulamalar tekrar edilmeli
Düzeltilmiş Belirginlik
Katsayısı
Çok değişkenli regresyon
modellerinde belirginlik
katsayısının niçin yetersiz
kaldığı ve belirginlik
katsayısı ile düzeltlmiş
belirginlik katsayısı
arasındaki ilişki
Ders notları
Uygulamalar tekrar edilmeli
240
Anahtar Kavramlar
Aralık Tahmini
Hipotez testi
Gauss Markov teoremi
Belirginlik Katsayısı
Düzeltilmiş belirginlik katsayısı
Regresyon Kareler Toplamı
Toplam değişme,
Hata Kareler Toplamı
241
Giriş
Bu bölümde daha önce basit regresyon modeli için gördüğümüz aralık tahminleri ve
hipotez testlerini çok değişkenli regresyon bağlamında tekrar edeceğiz. Ayrıca çok değişkenli
regresyonun uyumun iyiliği ölçüsü belirginlik katsayısının nasıl hesaplanacağını ele alacak ve
düzeltilmiş belirginlik katsayısını tanıtacağız.
242
9.1. En Küçük Kareler Tahmincilerinin Örnekleme Özellikleri
EKK tahmincileri 0 1 2, , rassal değişkenlerdir; farklı örneklerde farklı değerler alırlar
ve değerleri, bir örnek toplanana kadar ve değerleri hesaplanana kadar bilinmez. En küçük
kareler tahmincisinin örnekleme özellikleri, tahminlerin örnekten örneğe nasıl değiştiğini
gösterir. Bunlar, daha önceki derslerimizden de bilindiği üzere tahminlerin güvenilirliğini
değerlendirmede bir temel sağlar. Eğer model için 1-5 varsayımları sağlanırsa, en küçük kareler
tahmincisi sapmasızdır ve daha küçük bir varyansa sahip başka bir doğrusal sapmasız tahminci
yoktur. Bu sonuç, genel çok değişkenli regresyon modeli için doğru olmaya devam etmektedir.
Gauss Markov Teoremi: Çok değişkenli regresyon modeli için 1-5 varsayımları
sağlanırsa, EKK Tahmincileri parametrelerin en iyi (enküçük varyanslı), doğrusal, sapmasız
tahmincilerdir (BLUE).
Hataların normal dağıldığı varsayımı altında, Y de normal dağılan rassal değişkendir.
En küçük kareler tahmincileri de, Y’nin doğrusal fonksiyonları olduğu için normal olasılık
dağılımlarına sahip olacaktır. Hatalar normal dağılmazsa EKK tahmincileri, büyük örneklerde
yaklaşık olarak normal dağılacaktır. Burada “büyük ”den kastın ne olduğu karmaşıktır. Bu, her
ayrı uygulamaya özgü çok sayıda faktöre bağlıdır. Genelde, 𝑛 − 𝑘 = 50 ise yeterince büyük
sayılır. Normal veya yaklaşık olarak normal dağılım gösteren en küçük kareler tahmincilerine
sahip olmak, aralık tahminlerini oluşturmak ve regresyon modelindeki parametreler ile ilgili
hipotezleri test etmek için önemlidir.
9.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları
Hata varyansını tahmin etmenin temel sebebi, en küçük kareler tahmincilerinin
bilinmeyen varyans ve kovaryanslarının bir tahminini elde etmeyi bize sağlamasıdır. Burada,
EKK tahmincisinin genel özellikleri bağlamında varyans ve kovaryansları ele alacağız.
En küçük kareler tahmincilerinin varyans ve kovaryansları, 0 1, ve 2 tahmincilerinin
güvenilirliği ile ilgili bilgi sağlar. EKK tahmincileri sapmasız olduğu için, daha küçük
varyanslar doğru parametre değerlerine “yakın” tahminler sağlama olasılığının daha yüksek
olması anlamına gelecektir. 0 1 1 2 2ˆ ˆ ˆˆ
i i iY X X için, en küçük kareler tahmincilerinin
varyans ve kovaryansları, aşağıdaki gibidir.
2 2 2 2
1 2 2 1 1 2 1 2 2
0 22 2
1 2 1 2
21ˆ i i i i
i i i i
X x X x X X x xVar
n x x x x
2 22 2
1 2 2 22 21 121 2 1 2
ˆ veya(1 )
i
ii i i i
xVar
x rx x x x
243
2 21 2
2 2 2 22 22 121 2 1 2
ˆ veya(1 )
i
ii i i i
xVar
x rx x x x
2
121 2
2 2 2
12 1 2
ˆ ˆ( , )(1 ) i i
rKov
r x x
Burada 12r , 1X ile 2X arasındaki örnek korelasyon katsayıdır.
1 2
12 2 2
1 2
i i
i i
x xr
x x
1 ’nin varyansını etkileyen faktörler aşağıdaki gibidir.
1. Hata terimi varyansının ( 2 ) büyük olması, EKK tahmincileri varyanslarının da büyük
olmasına yol açar. Bu beklenen durumdur, çünkü 2 model tanımlamasındaki tüm belirsizliği
ölçmektedir. 2 büyükse, veri değerleri regresyon fonksiyonu 0 1 1 2 2( )i i iE Y X X
etrafında geniş bir şekilde yayılacak ve verilerde, parametre değerleri ile ilgili daha az bilgi söz
konusu olacaktır. 2 küçükse, veri değerleri regresyon fonksiyonu 0 1 1 2 2( )i i iE Y X X
etrafında yoğun bir şekilde yayılacak ve verilerde, parametre değerlerinin ne olabileceği ile
ilgili daha fazla bilgi söz konusu olacaktır.
2. Daha büyük örnekler (n) ile çalışılması, EKK tahmincilerinin varyanslarının daha küçük
olmasını sağlar. Şöyle ki; n’nin daha büyük değeri, X deki değişmenin 2 2
1 1 1i iX X x değerinin daha büyük olması anlamına gelir. Bu terim, varyans formülünün paydasında yer alır
ve 2
1ix teriminin değeri büyük olduğunda, 1ˆVar küçük olur. Daha fazla gözlem, daha
kesin parametre tahmini sağlar.
3. Bağımsız bir değişkenin 2 2
1 1 1i iX X x ile ölçülen ortalama etrafındaki değişiminin
daha fazla olması EKK tahmincisinin daha küçük varyansa sahip olmasını sağlar. 1 ’yi hassas
bir şekilde tahmin etmek için 1X ’de daha fazla değişim istenir bir özelliktir. 1X ’de değişim
küçük olursa, değişimin etkisini ölçmek zordur. Bu zorluk, 1 için daha büyük varyans olarak
yansıtılacaktır.
4. 1X ile 2X arasındaki yüksek korelasyon, 1 ’nin varyansının da büyük olmasına yol açar.
Varyans formülünün paydasında 121 r vardır. 12r ’ün değeri 1’e yakınsa, 121 r küçük
olacak, bu da 1ˆVar ’nin büyük çıkmasına sebep olacaktır. Bu durum nedeni ise; 1X ’in
ortalaması etrafındaki değişim, diğer açıklayıcı değişkenlerdeki değişimle ilişkili olmadığında
tahmin kesinliğine daha fazla katkı yapar. Bir açıklayıcı değişkendeki değişim, diğer bir
244
açıklayıcı değişkendeki değişimle ilişkili olduğunda, onların farklı etkilerini ayrıştırmak zordur.
Doğrusal bağlantı ile adlandırılan bu durum EKK tahmincilerinin büyük varyansları olmasına
sebep olur.
En küçük kareler tahmincilerinin tahmin edilen varyans ve kovaryanslarını, matris
olarak isimlendirilen bir kare dizilimde düzenlemek gelenek olmuştur. Bu matrisde, köşegen
varyansları ve köşegen dışı unsurlar ise kovaryansları ifade eder.r. Varyans-kovaryans matrisi
veya daha basitçe kovaryans matrisi olarak isimlendirilir. k=3 iken, kovaryans matrisinde
varyans ve kovaryansların sıralaması aşağıdaki gibidir,
0 0 1 0 2
0 1 1 1 2
0 2 1 2 2
ˆ ˆ ˆ ˆ ˆ, ,
ˆ ˆ ˆ ˆ ˆ ˆ, ,
ˆ ˆ ˆ ˆ ˆ, ,
i
Var Cov Cov
Var Cov Cov Var Cov
Cov Cov Var
Varyans –Kovaryans matrisi simetrik bir matristir.
9.2. Açıklayıcı Örnek: İthalat Modeli
Bu aşamada İthalat modelindeki parametrelere uygulanacak hipotez testleri ve aralık
tahmini için gerekli olan parametrelerin varyansları tahmin edilecektir.
2 2 2 2
1 2 2 1 1 2 1 2 2
0 22 2
1 2 1 2
21ˆ ˆi i i i
i i i i
X x X x X X x xVar
n x x x x
2 2
0 2
15 2 2 84 2 15 2 101ˆ 0.564 84 2 (10)
Var
150.9
2
2 2
1 22 2
1 2 1 2
ˆ ˆi
i i i i
xVar
x x x x
1 2
2ˆ 0.5684 2 (10)
Var
0.01647
2
1 2
2 22 2
1 2 1 2
ˆ ˆi
i i i i
xVar
x x x x
245
2 2
84ˆ 0.5684 2 (10)
Var
0.69176
0 1ˆ ˆ, ve 2 tahmin edilen varyanslarının karekökleri standart hatalarıdır. Hesaplanmış
standart hatalar gibidir:
0 150.9ˆ 12.28Se
1 0.01647ˆ 0.128Se
2 0.69176ˆ 0.832Se
Bu aşamaya kadar ulaştığımız sonuçları aşağıdaki gibi raporlayabiliriz.
1 2ˆ ˆ2.82 0.58 0.94 0.4907
ˆ( ) (12.28)(0.128) (0.832)
i
i
Y X X
Se
9.3. En Küçük Kareler Tahmincilerinin Dağılımı
Çoklu değişkenli regresyon modelinim 1-5 varsayımları geçerli ise, en küçük kareler
tahmincileri 0 1 2 1ˆ ˆ ˆ ˆ, , , , k
0 1 1 2 2 1 1i i i k ik iY X X X u
modelindeki 0 1 2 1, , , , k parametrelerinin, en iyi doğrusal sapmasız tahmincileri
olduğunu olduğu bilinmektedir.
Rassal hataların iu normal olasılık dağılımına sahip olduğu varsayımı da eklenirse, bu
durumda bağımlı değişken iY ’de normal olarak dağılır ve aşağıdaki gibi ifade edilir,
2 2
0 1 1 2 2 1 1 , 0,i i i k ik iY N X X X u
EKK tahmincileri, bağımlı değişkenin doğrusal fonksiyonu olduğu için, EKK
tahmincileri de normal olarak dağılım gösterir ve aşağıdaki gibi ifade edilir.
ˆ ˆ, ( )i i iN Var
246
Buna göre her ˆi , i ortalama ve ˆ( )iVar varyans ile normal dağılıma sahiptir. Normal
rassal değişken ˆi , ortalamasından çıkarılarak ve varyansının kareköküne bölünerek, aşağıda
ifade edilen, ortalaması sıfır ve varyansı 1 olan, standart normal değişken Z’ye dönüştürülebilir.
ˆ
0,1ˆ
i i
i
Z NVar
ˆi ‘nın varyansı, yukarıda k=3 olduğu durumunda gösterildiği gibi, hata teriminin
bilinmeyen varyansına 2 bağlıdır. 2 yi, yukarıda elde edilen tahmincisi 2 ile yer
değiştirirsek, tahmin edilen ˆiVar ’ı elde ederiz. Z’de ˆVar yerine ˆVar ’nın tahmini
yazılırsa, N(0,1) rassal değişkenini, bir t-rassal değişkenine dönüştürür. Yani aşağıdaki gibi
ifade edilebilir,
ˆ ˆ
ˆˆ
i i i in k
ii
t tSeVar
Bu sonuç basit regresyondakinden farkı t-rassal değişkenin serbestlik dereceleridir.
Basit regresyonda tahmin edilen parametre sayısı iki olduğu için serbestlik derecesi 𝑛 − 2 idi.
Bu bölümde, Çok değişkenli regresyon modelinde k sayıda bilinmeyen parametre vardır ve t-
istatistiği için serbestlik derecesi sayısı 𝑛 − 𝑘’dır.
9.3.1. Aralık Tahmini
Çok değişkenli regresyon modelinde yer alan parametrelerin aralık tahminlerindeki
prosedür basit regresyon modeli ile aynıdır. Sadece n k serbestlik derecesinde yer alan ve
parametre sayısı gösteren k değişecek buna bağlı olarak da kritik değer (eşik değer) olarak
isimlendirdiğimiz ct değişiklik gösterecektir. Basit regresyonda uygulanan yolu izleyerek
0.05 verilmişse n k serbestlik derecesine sahip olduğumuz anımsayarak
0.95c cP t t t
yazarız. Hatırlanacağı üzere 0.975,c n kt t
; n k
t dağılımının 97.5’lik yüzdelik dilimidir ( ct ’nin
solundaki alan veya olasılık, 0.975’tir) ve 0.025,c n kt t
, n k
t dağılımının 2.5’lik yüzdelik
dilimidir.)
Test istatistiği:
1 1
1
ˆ
ˆt
Se
247
olduğuna göre aralık tahmini için aşağıdaki ifade yazılır.
1 1
1
ˆ0.95
ˆc cP t tSe
Bu ifadeyi yeniden düzenlediğimize, aşağıdakini elde ederiz,
1 1 1 1 1ˆ ˆ ˆ ˆ 0.95c cP t Se t Se
Aralık bitiş noktaları aşağıdaki gibidir,
1 1 1 1ˆ ˆ ˆ ˆ,c ct Se t Se
Yukarıdaki aralık 1 ’nin %95 aralık tahmincisidir. Bu aralık tahmincisi, ana kütleden
elde edilen pek çok örnekte kullanılırsa, bunların %95’i doğru parametre 1 ’yi içerir.
Genel olarak, herhangi bir i ’nin 100 1 % güven aralığı için genel bir formülü
aşağıdaki gibi ifade edilir.
1 2, 1 2,ˆ ˆ ˆ ˆ,i i i in k n k
t Se t Se
9.3.2. Hipotez Testi
t-dağılımı sonucu, parametrelerin her biri ile ilgili hipotezleri test etme için bir temel
sağlar. Basit regresyondan bilindiği üzere c’nin belirlenmiş bir sabit olduğu 0 : iH c ’ye
karşı 1 : iH c şeklindeki hipotezler, çift-kuyruklu testler olarak isimlendirilir, 0 : iH c
’ye karşı 1 : iH c gibi eşitsizlikleri içeren hipotezler, tek-kuyruklu testler olarak
isimlendirilir. Bu bölümde, basit regresyonda olduğu gibi sadece çift kuyruklu testler ele
alınacaktır.
Çok değişkenli regresyon modeli oluşturulduğunda, modelde yer alan bağımsız
değişkenlerin ( 1 2 1, , , kX X X ) bağımlı değişkeni Y ’yi etkilediğine inanırız. Ancak bu etkinin
varlığının doğrulanması için; modelin veri ile desteklenip desteklenmediğinin incelenmesi
gerekir. Diğer bir ifade ile verilerin, Y ’nin her bir açıklayıcı değişken ile ilişkili olduğunu
gösteren bir kanıt sağlayıp sağlamadığı bilmemiz gerekir. Veri bir açıklayıcı değişken, örneğin
iX , Y ile ilişkili değilse 0i olacaktır. 0i temel hipotezi test etme bağımsız değişken iX
için anlamlılık testi olarak isimlendirilir
248
Anlamlılık sınaması için hipotez testinin aşamaları
1. Temel ve alternatif hipotezler,
0 1: 0H
1 1: 0H
2. Temel hipotez doğruysa, test istatistiği aşağıdaki gibidir.
1
1
ˆ
ˆ n kt t
Se
n:gözlem sayısı, k:parametre sayısı
3. %5 anlamlılık düzeyini (α=0.05) kullanarak ve 75 3 72n k serbestlik
derecesi olduğunu anımsayarak, dağılımın her bir kuyruğunda 0.025 olasılığını
sağlayan kritik değerler, 1 2:n kt
ve 2:n kt
. Bu sebeple,
4. 2. aşamada hesaplanan t-değeri, şu şekilde ise, 1 2:n k
t t
veya 2:n k
t t
temel
hipotezi reddederiz. Eğer 2: 1 2:n k n kt t t
ise, H0’ı reddedemeyiz
Bir parametre tahmininin anlamlılığının testi önemlidir. Parametrenin tahmini anlamlı
ise ilgili açıklayıcı değişkenin, modele dahil edilecek değişken olduğuna dair ön inancını
doğrular.
9.4. Uyum İyiliğinin Ölçülmesi: Belirginlik Katsayısı
Basit regresyon modeli için, bağımsız değişkenle açıklanan değişmenin toplam
değişmeye oranı ile ölçülen belirlilik katsayısını 𝑟2, çok değişkenli regresyon modeli için de
kullanılır aynı formüller geçerlidir. Belirlilik katsayısı aşağıdaki gibi hesaplandığı basit
regresyon modelinden bilinmektedir.
2 2
2
2 2
ˆ ˆ( )
( )
i i
i i
Y Y y RKTR
Y Y y BKT
veya
2 2
2
2 2
ˆ ˆ( )1 1 1
( )
i i i
i i
Y Y uHKTR
BKT Y Y y
Burada RKT, Y’deki toplam değişimin model ( regresyon kareler toplamı) tarafından
“açıklanan” kısmı, BKT, Y’nin ortalaması etrafındaki toplam değişimi ( bütün kareler toplamı)
ve HKT, EKK kalıntı (hata) kareler toplamı olup, Y’deki değişimin model tarafından
açıklanamayan kısmıdır.
249
ˆiY simgesi, bağımsız değişkenlerin örnek değerlerinin her biri için Y’ nin öngörülmüş
değerini gösterir. ˆiY aşağıdaki gibi ifade edilir.
0 1 1 2 2 1 1ˆ ˆ ˆ ˆˆ
i i i k ikY X X X
Model bir kesim terimi ( 0 ) içerdikçe, bağımlı değişkenin örnek ortalamasıY , hem
iY ’nin hem de Y ortalamasıdır ( ˆY Y )
Y için örnek standart sapması aşağıdaki gibi ifade edilebilir,
2 2
1 1
1 1( )
1 1 1
n n
Y i i
i i
BKTS Y Y y
n n n
ve böylece, 2( 1) YBKT n S olur.
Belirginlik katsayısı 0 ile 1 arasında değer alır. R2 nin değeri yükseldikçe regresyon
düzleminin örnek gözlemlerine uyumu artar. k-1 sayıda bağımsız değişkeni olan çok değişkenli
bir regresyon modeli için R2 formülünü genişletilirse;
2
1 1 2 2 1 12
2 2 2
ˆ ˆ ˆˆi i i i i k ik i
i i
y x y x y x yR
y Y nY
sonucuna ulaşılır. Bağımlı değişken üzerinde etkili olsun veya olmasın modele giren her
değişken belirginlik katsayısı R2 nin değerini arttıracaktır. Şöyle ki; R2 eşitliğindeki toplam
değişme(2
iy ) bağımsız değişkenlerden bağımsızdır ve değeri sabittir. Modele giren her
değişken regresyonla açıklanan değişmeyi (2ˆiy ) arttıracaktır. Paydanın (
2
iy ) değeri sabit
iken payın (2ˆiy ) değerinin artması belirginlik katsayısının yanıltıcı şekilde artmasına neden
olur. Bu mahsuru ortadan kaldırmak için çok değişkenli regresyon modellerinde genellikle R2
yerine düzeltilmiş R2hesaplanır. Düzeltilmiş belirginlik katsayısı 2R ile gösterilir ve
2 2 11 (1 )
nR R
n k
‘e eşittir. Düzeltilmiş R2( 2R ), belirginlik katsayısının serbestlik derecesiyle yeniden
düzenlenmiş halidir. Gözlem sayısı yeterince büyükse 2R ile R2 birbirine yakındır. Ancak
gözlem sayısı küçükse düzeltilmiş belirginlik katsayısı, belirginlik katsayısından daha küçüktür
( 2 2R R )hatta belirginlik katsayısı negatif değer almazken (orijinden geçen regresyon hariç) 2R negatif değer alabilmektedir. Belirsizlik katsayısı yine 1-R2‘ye eşittir.
Alternatif modellerin R2 kriterine göre karşılaştırılabilmesi için bağımlı değişkenin aynı
olması gerekir. Şöyle ki; aynı değişkenler arasındaki ilişkiyi açıklayan
250
0 1 1 2 2ˆ ˆ ˆˆ
i i iY X X
ile
0 1 1 2 2ˆ ˆ ˆˆln ln lni i iY X X
modelleri arasında tercih yapmak için R2 uygun bir ölçü değildir. Çünkü Y’deki toplam değişim
ile ln Y’deki toplam değişim aynı değildir.
Y ile X arasındaki ilişkinin derecesini gösteren basit korelasyon katsayısını (r), basit
regresyon modelinde belirginlik katsayısının ( 2r ) karekökünden elde etmenin mümkün
olduğunu biliyoruz. Çok değişkenli regresyon modelinde belirginlik katsayısının (R2) karekökü
çoklu korelasyon katsayısına eşittir. Çoklu korelasyon katsayısı da bağımlı değişken ile
bağımsız değişkenler arasındaki ilişkinin derecesini gösterir. Ancak kısmi korelasyon
katsayılarının işareti farklı olduğu için, belirginlik katsayısından hesaplanan çoklu korelasyon
katsayısına artı veya eksi işaret verilemez. Bu nedenden dolayı, uygulamada genellikle
belirginlik katsayısı hesaplanır ve yorumlanır.
251
Uygulamalar
252
Uygulama Soruları
1) 1 2ˆln 0.81 0.02ln 1.98lnY X X modelinin yorumu ile ilgili aşağıdakilerden
hangisi doğrudur?
a. 2X sabit iken 1X ’deki %1’lik artış Y’yi % 20 düşürür.
b. 1X sabit iken 2X ’deki %1 birimlik artış Y’yi % 1.98 birim artırır.
c. ln 2X sabit iken ln 1X ’deki %1 birimlik artış lnY’yi % 0.02 birim düşürür.
d. ln 2X sabit iken ln 1X ’deki %1 artış lnY’yi % 0.02 düşürür.
e. 2X sabit iken 1X ’deki %1’lik artış Y’yi % 0.02 düşürür.
2) 0 1 1 2 2ˆ ˆ ˆY X X modelinde 1 ’in varyans tahmincisi aşağıdaki gibidir.
2 22 2
1 2 2 22 21 121 2 1 2
ˆ(1 )
i
ii i i i
xVar
x rx x x x
Buna göre aşağıdakilerden hangisi yanlıştır.
a. Hata teriminin varyansının büyük olması 1 ’in varyansının büyük olmasına yol açar.
b. Gözlem sayısının büyük olması, 1 ’in varyansının küçük olmasını sağlar.
c. 1X ‘deki değişim (2
1 1( )iX X ) büyük ise 1 ’in varyansı da büyüktür.
d. 1X ile 2X arasındaki yüksek korelasyon 1 ’in varyansının büyük olmasına yol açar.
e. 2
121 r büyük ise 1 ’in varyansı da büyük tahmin edilecektir.
3-6 arası sorular aşağıa raporlarmış veriler göre cevaplandırılacaktır.
25 yıllık verilerden 1 2ˆ 0.69 1.372 0.902Y X X modeli tahmin edilmiştir. Modelinin
varyans-kovaryans matrisi aşağıdaki gibidir.
16 25 81
ˆ 25 9 49
81 49 4
iVar Cov
3) Aşağıdakilerden hangisi yanlıştır.
a) 1 ’in standart hatası 3’e eşittir.
253
b) 2 ’nin varyansı 4’e eşittir.
c) 0 ile 1 arasındaki ortak varyans (kovaryans) -25’e eşittir.
d) 0 ile 2 arasındaki ortak varyans (kovaryans) -49’a eşittir.
e) 0 ’nin varyansı 16’ya eşittir.
4) 0.10 düzeyinde 0 parametresi ile ilgili anlamlılık testi sonuçlarına ilişkin
aşağıdakilerden hangisi doğrudur.
a) Test istatistiğinin değeri: 0.1725, 1.717ct ,
0 istatistiksel açıdan anlamsız.
b) Test istatistiğinin değeri: 0.1725, 1.708ct ,
0 istatistiksel açıdan anlamsız.
c) Test istatistiğinin değeri: 5.80, 2.060ct ,
0 istatistiksel açıdan anlamlı.
d) Test istatistiğinin değeri: 0.1725, 2.074ct ,
0 istatistiksel açıdan anlamlı.
e) Test istatistiğinin değeri: 5.80, 1.717ct ,
0 istatistiksel açıdan anlamlı.
5) 0.10 düzeyinde 0 parametresi için oluşturulan güven aralıkları
aşağıdakilerden hangisidir?
a) (-3.749 ;11.824)
b) (-6.178;7.558)
c) (-1.945;8.896)
d) (3.6109; 9.801)
e) (2.725;10.175)
6) 0.05 düzeyinde 2 parametresi ile ilgili anlamlılık testi sonuçlarına ilişkin
aşağıdakilerden hangisi doğrudur.
a) Test istatistiğinin değeri: (-0.451), 2.074ct , 2 istatistiksel açıdan anlamsız
b) Test istatistiğinin değeri: (0.451), 2.074ct , 2 istatistiksel açıdan anlamlı.
c) Test istatistiğinin değeri: (-0.451), 2.074ct , 2 istatistiksel açıdan anlamlı.
d) Test istatistiğinin değeri: (0.451), 2.060ct , 2 istatistiksel açıdan anlamlı.
e) Test istatistiğinin değeri: (-0.451), 2.060ct , 2 istatistiksel açıdan anlamsız.
7-10 arası sorular aşağıdaki veriler kullanılarak cevaplandırılacaktır.
1 2 3ˆ 27.02 1.61 11.03 1.89Y X X X
254
1 2 35.8 , 2.7 , 12.94yx yx yx
2 273 4.1 12iY Y n
7) Regresyon ile açıklanan değişme aşağıdakilerden hangisidir?
a) 32.8
b) 1173
c) 21.44
d) 971.28
e) 14.66
8) Belirginlik katsayısının değeri nedir?
a) 0.21
b) 0.72
c) 0.42
d) 0.81
e) 1.05
9) Düzeltilmiş belirginlik katsayısının değeri nedir?
a) 0.69
b) 0.37
c) 0.75
d) -0.05
e) -0.09
10) Toplam değişme …….iken, modele giren her değişken regresyon ile ……….
değişmenin değerini….., ,bu nedenle çok değişkenli regresyon modelinde ……
yorumlanması uygundur.
a) sabit; açıklanabilen; attırır; düzeltilmiş belirginlik katsayısının
b) bağımlı değişenin değerine eşit; açıklanamayan; azaltır; düzeltilmiş belirginlik
katsayısının
c) sabit; açıklanabilen; azaltır; düzeltilmiş belirginlik katsayısının
d) regresyonla açıklanamayan değişmeye eşit; açıklanabilen; attırır; düzeltilmiş
belirginlik katsayısının
e) sabit; açıklanamayan; arttırır; düzeltilmiş belirginlik katsayısının
255
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde çok değişkenli regresyon modellerinden en basiti olan iki bağımsız
değişkenli bir modelde tahmin edilen parametrelerin varyans ve kovaryanslarının nasıl
hesaplandığını gördük. Tahmin edilen parametrelerin dağılım özellikleri üzerinde durduk, çok
değişkenli regresyon modeli parametrelerinin de normal dağılıma uygunluk gösterdiğini
belirttik. Bu bağlamda basit regresyon modeli için uyguladığımız hipotez testleri ve güven
aralıklarının sadece serbestlik derecesindeki farklılıkla aynen çok değişkenli regresyon modeli
için de uygulanabildiğini örneklerle gösterdik. Ayrıca çok değişkenli regresyon modelleri için
regresyon doğrusunun verilere uyumu için belirginlik katsayısının güvenilir bir ölçü olmadığını
düzeltilmiş belirginlik katsayısının hesaplanarak yorumlanması gerektiğini belirttik.
256
Bölüm Soruları
1) Aşağıdaki ifadelerden hangisi yanlıştır.
a. Tahmin edilen parametrelerin varayns ve kovaryansları parametrelerinin
güvenirliliği hakkında bilgi sağlar.
b. Gauss Markow teoremine göre çok değişkenli regresyon modelinde temel
varsayımlar sağlanırsa, EKK tahmincileri en iyi doğrusal sapmasız tahmincilerdir.
c. Varyans kovaryans mtrisinin diagonal elemanları tahmin edilen parametrelerin
varyanslarını diagonal dışı elemanları kovaryansları verir.
d. Çok değişkenli regresyon modelinde tahmin edilen parametreler normal dağılıma
uygundur.
e. Hata teriminin varyansının büyük olması, tahmin edilen parametrelerin
varyanslarının küçük çıkmasını sağlar.
2) 20 gözlemlik verilerden aşağıdaki modelleri tahmin edilmiştir.
1. Model 2
1 2ˆln 3.09 1.62 0.89 0.56iY X X R
2. Model 2
1 3ˆ 23.09 0.71 5.61 0.72iY X X R
Her iki modelin düzeltilmiş belirginlik katsayısı ve hangi modelin tercih edileceği
aşağıdaki şıklardan hangisinde doğru verilmiştir?
a) 1. Model 2 0.51R , 2. Model 2 0.69R
Bağımlı değişkenlerdeki toplam değişme farklı olduğu için iki model karşılaştırılamaz.
b) 1. Model 2 0.61R , 2. Model 2 0.75R
Düzeltilmiş belirginlik katsayısı büyük olduğu için ikinci model tercih edilir.
c) 1. Model 2 0.61R , 2. Model 2 0.75R
Düzeltilmiş belirginlik katsayısı küçük olduğu için birinci model tercih edilir.
d) 1. Model 2 0.51R , 2. Model 2 0.69R
Düzeltilmiş belirginlik katsayısı büyük olduğu için ikinci model tercih edilir.
e) 1. Model 2 0.51R , 2. Model 2 0.69R
Düzeltilmiş belirginlik katsayısı küçük olduğu için birinci model tercih edilir.
3) 2
1 3ˆ 23.09 0.71 5.61 0.72iY X X R n=20 modelindeki 0.71 olarak tahmin
edilen parametrenin varyansı 0.04 ise 0.05 anlamlılık seviyesinde
parametrenin anlamlılığı için test istatistiğinin değeri, testin tablo değeri ve karar
aşağıdakilerden hangisidir.
a) t=3.55, tc=2.110, alternatif hipotez kabul, parametre anlamlı
b) t=17.75 , tc=1.740, temel hipotez kabul, parametre anlamlı
c) t=3.55 , tc=1.740, alternatif hipotez kabul, parametre anlamlı
d) t=0.06, tc=2.110, temel hipotez kabul, parametre anlamsız
e) t=3.55 , tc=2.110, temel hipotez kabul, parametre anlamsız
257
4) Aşağıdaki veriler göre düzeltilmiş belirginlik katsayısının değeri nedir? 2 2ˆ2951 399 17 4i iy u n k
a) 0.83
b) 0.87
c) 0.80
d) 0.71
e) 0.42
5) Belirginlik katsayısı ile düzeltilmiş belirginlik katsayısı arasında nasıl bir ilişki
vardır.
a) 2 2R R
b) 2 2(1 )R R
c) 2 2 1R R
d) 2 2R R
e) 2 21 (1 ) 1R R n k n
6) Alternatif modellerin belirginlik katsayısına göre karşılaştırabilmesi için
…………………olmalıdır.
a) Bağımlı değişken aynı biçimde ifade edilmiş
b) Fonksiyonel biçimi aynı
c) Bağımsız değişkenleri aynı
d) Gözlem sayısı aynı
e) Regresyon ile açıklanan değişme aynı olmalıdır.
7) Çok değişkenli regresyon modellerinde n=gözlem sayısı, k=parametre sayısı
olmak üzere hipotez testi ve güven aralıklarının oluşturulmasında kullanılan
serbestlik derecesi nedir?
a) n-(k-1)
b) (n-1)-(k-1)
c) (n-1)-(n-k)
d) n-k
e) n-2
8) 0 1 1 2 2i i i iY X X u modelinde 0 2: 0H temel hipotezine karşılık
1 2: 0H alternatif hipotezi sınamak için aşağıdaki ifadelerden hangisi
doğrudur?
a) Çift taraflı F testi
b) Çift taraflı ki-kare testi
c) Çift taraflı t testi
d) Tek taraflı t testi
e) Tek taraflı F sınaması
258
9) Belirginlik katsayısı 2R için aşağıdaki ifadelerden hangisi yanlıştır?
a) Düzeltilmiş 2R negatif değer alabilir.
b) Her zaman 2 1R
c) Modele eklenecek her yeni değişken 2R değerini arttırmaktadır.
d) Modele eklenecek her yeni değişken 2R değerini arttırmayabilecektir.
e) 0 1 1i i iY X u modeli için 1
22
,Y XR r geçerlidir; 1,Y Xr , korelasyon
katsayısıdır.
10) 0 1 1 2 2i i i iY X X u modelinde 2 parametresi için anlamalılık sınaması
yapıldığında temel ve alternatif hipotezler aşağıdaki şıklardan hangisinde doğru
olarak verilmiştir?
a) 0 2
1 2
: 0
: 0
H
H
b) 0 2
1 2
: 0
: 0
H
H
c) 0 2
1 2
: 0
: 0
H
H
d) 0 2
1 2
: 0
: 0
H
H
e) 0 2
1 2
: 0
: 0
H
H
Cevaplar
1) e
2) d
3) c
4) c
5) e
6) a
259
7) d
8) a
9) b
10)a
260
10. ÇOK DEĞİŞKENLİ REGRESYON MODELİNDE İLERİ
ÇIKARSAMA
261
Bu Bölümde Neler Öğreneceğiz?
10.1. Birleşik Hipotezlerin Testi
10.2. F-Testi
10.3. Modelin Anlamlılığının Testi
10.4. F- ve t- Testleri Arasındaki İlişki
10.5. Varyans Analiz (ANOVA) Tablosu
262
Bölüm Hakkında İlgi Oluşturan Sorular
1) Kısıtlı ve kısıtsız model ne demektir?
2) F testi nasıl uygulanır?
3) ANOVA tablosu nasıl düzenlenir?
4) Regresyonun anlamlılığı nasıl test edilir?
263
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Birleşik
Hipotezlerin Testi
Kısıtlı ve kısıtsız hata kareleri toplamı
kavramını ve hipotezleri test etmek için
nasıl kullanıldığını açıklayabilmek.
Ders notları tekrar edilmeli
Modelin
Anlamlılığının
Testi
Birleşik temel hipotezleri test etmek
için F-testini kullanabilmek.
Ders notları ve uygulamalar
tekrar edilmeli
Modelin
Anlamlılığının
Testi
Regresyon modelinin genel
anlamlılığını test edebilmek
Ders notları ve uygulamalar
tekrar edilmeli
Modelin
Anlamlılığının
Testi
Varyans Analiz Tablosunu oluşturmak
ve ne amaçla kullanıldığını bilmek
Ders notları ve uygulamalar
tekrar edilmeli
264
Anahtar Kavramlar
Kısıtlı Model
Kısıtsız Model
ANOVA tablosu
F testi
Kısıtlı modelin kalıntı kareler toplamı
Bileşik hipotez
Kısıtsız modelin kalıntı kareler toplamı
Kısıtlı en küçük kareler yöntemi
Örnek dışı bilgi
Regresyonun anlamlılığı
265
Giriş
İktisatçılar, iktisadi davranış ile ilgili teorileri geliştirir ve değerlendirirler.
Ekonometrisyenler ise iktisat teorisini ekonometrik model ile tahmin ederek, hipotez testleri ile
iktisat teorilerini test ederler. Çok değişkenli regresyon modelinden elde edilen tek parametre
i üzerine tek bir kısıttan oluşan temel hipotezler için t-testlerinin nasıl uygulanacağını
öğrenmiş bulunmaktayız. Bu dersimizde, önceki analizimizi, iki veya daha fazla parametre
üzerine kısıtları içeren temel hipotezin testini görecek ve bu bağlamda F-testinin nasıl
uygulanacağını göreceğiz
266
10.1. Birleşik Hipotezlerin Testi
Daha önceki bölümlerde tek bir parametre için hipotezlerin testi için çift-kuyruklu
testlerin nasıl kullanılacağını öğrenmiş bulunmaktayız. Tek bir parametre için hipotez testi,
sadece parametre ve parametre standart hatasının tahminini gerektirdiği için basittir.
Çit kuyruklu tüm t-testlerinin önemli bir özelliği, bir veya daha fazla parametre ile ilgili
tek bir tahmini içermesidir. Bu bölümde, parametreler ile ilgili çoklu tahminleri içeren temel
hipotezler doğru hipotez testini genişletme ile ilgileneceğiz. Birden fazla eşitlik işareti ile ifade
edilen çoklu tahminler ile ilgili temel hipotez, birleşik hipotez olarak isimlendirilir. Birleşik
hipotezin bir örneği, bir grup açıklayıcı değişkenin belirli bir modelde yer alıp almamasının test
edilmesidir. Bir ürün için talep edilen miktar, rakip malların fiyatlarına ( 1RMP , 2RMP ) mı
yoksa sadece kendi fiyatına ( P ) mı bağlıdır? Bunlar gibi iktisadi hipotezler, model
parametreleri ile ilgili formüllere dönüştürülmek zorundadır.
0 1 2 31 2i i i i iD P RMP RMP u
Temel hipotez tüm rakip malların fiyatlarının katsayılarının sıfıra eşit olması olacaktır.
0 2 0 3: 0 , : 0H H
veya
0 2 3: 0H
burada, 2 ve 3 ikame malların fiyatlarının katsayılarıdır. Yukarıdaki birleşik temel hipotez,
iki tahmin ( iki eşittir işareti) : 0 2: 0H ve
0 3: 0H olduğunu içerir. 0H testi, iki
tahminin aynı zamanda sağlanıp sağlanmadığı için bir birleşik testtir.
10.2. F-testi
Birleşik bir hipotezin test için F-testi kullanılmaktadır. Bu testi ve bununla ilgili
kavramları tanıtmak için, satış modeline reklam harcamaları karesinin de dahil edildiği
genişletilmiş model kullanılacaktır.
2
0 1 1 2 2 3 2i i i i iY X X X u
Reklam harcamalarının satışlar üzerinde etkili olup olmadığını test etmek istediğimizi
varsayalım. Reklam, hem bir doğrusal terim 2X hem de ikinci dereceden bir terim 2
2X olarak
modelde yer aldığı için, ancak 2 0 ve 3 0 ise reklam harcamalarının satışlar üzerindeki
etkisi olmayacaktır. 2 ve
3 sıfır olmadığında kısaca 2 0 ve
3 0 ise reklam harcamaları
satışlar üzerinde bir etkiye sahip olacaktır. Böylece, bu test için temel ve alternatif hipotezler
aşağıdaki gibidir.
0 2 3: 0 , 0H ,
1 2 3, : 0 0H veya her ikisi de sıfır değil
267
Temel hipotez 0 2 3: 0 , 0H ‘a göre, yukarıdaki model kısıtsız model olarak
adlandırılır. Temel hipotezdeki kısıtlar, modele uygulanmamıştır. 0H ’daki parametre
kısıtlarının doğru olduğu varsayımıyla elde edilen yeni model ise kısıtlı model olarak
adlandırılır 𝐻0 doğru iken, 2 30 , 0 ,
2X ve 2
2X modelden çıkarılırsa, kısıtlı model
aşağıdaki gibi olur.
0 1 1i i iY X u
0 2 3: 0 , 0H hipotezinin testi için kullanılan F-testi, kısıtsız modelin ve kısıtlı
modelin hata kareleri toplamlarının ( en küçük kareler kalıntılarının kareli toplamları)
karşılaştırılmasına dayanır. Bu iki toplam için sırasıyla kısaca 2ˆ
KSZu ve
2ˆ
KSLu ile gösterilir.
Bir regresyona değişken veya değişkenlerin eklenmesi hata kareleri toplamını
azaltacaktır. Bağımlı değişkendeki değişme diğer bir ifade ile toplam değişme ( BKT ) modelde
yer alan bağımsız değişken sayısından bağımsız olup, sabittir. Modele giren her bağımsız
değişken regresyon ile açıklanan değişmeyi (RKT) arttıracağı için, kısıtsız modelin
kalıntılarının kareleri toplamı kısıtlı modelin kalıntılar kareleri toplamından küçük olacaktır.
Dolayısıyla kısaltmaları açısından, 2 2ˆ ˆ 0
KSZ KSLu u olur.
2 2ˆ ˆ
KSL KSZu u ise
2 2
KSL KSZR R olduğu sonucunu çıkarabiliriz.
Satış gelirleri için kısıtsız ve kısıtlı olmak üzere iki alternatif modelin tahmin sonuçları
ve kalıntı kareler toplamı aşağıdaki gibidir.
2
0 1 1 2 2 3 2i i i i iY X X X u 2ˆ 1532.084
KSZu
0 1 1i i iY X u 2ˆ 1896.391
KSLu
Dikkat edilirse, kısıtlı modelin hata kareleri toplamını kısıtsız modelin hata terimi
toplamından küçüktür.
F-testi bu azalmanın anlamlı olup olmadığını test etmektir. Ek değişkenleri ekleme, hata
kareleri toplamı üzerinde çok aza etkiye sahipse, bu değişkenler bağımlı değişkendeki değişimi
açıklamaya çok az katkı yapar ve onları modelden çıkaracak temel hipotez için destek oluşur.
Diğer yandan, eğer değişkenleri ekleme, hata kareleri toplamında büyük bir azalmaya
yol açarsa, bu değişkenler bağımlı değişkendeki değişimi açıklamaya anlamlı bir şekilde katkı
yapar ve temel hipoteze karşı kanıtımız olur. F-testi, hata kareleri toplamında büyük bir azalma
veya küçük bir azalmayı neyin oluşturduğunu belirler. Buna göre F-testi için test istatistiği
aşağıdaki gibidir.
2 2
2
ˆ ˆ
ˆ
KSZKSL
KSZ
u u vF
u n k
veya
268
2 2
,21
KSZ KSL
v n k
KSZ
R R vF F
R n k
Burada, v kısıtlama sayısı, n gözlem sayısı ve k ise kısıtsız modeldeki parametre
sayısıdır.
Eğer temel hipotez doğruysa, F istatistiği, payda v serbestlik dereceli ve paydada n-k
serbestlik derece ile F-dağılımına sahip olur. Eğer temel hipotez doğru değilse, 2ˆ
KSZu ve
2ˆ
KSLu arasındaki fark büyük olacak ve temel hipotez ile modelde yer alan kısıtların modelin
verilere uyum sağlama kabiliyetini anlamlı bir şekilde azalttığı anlamına gelir. Böylece2 2ˆ ˆ
KSL KSZu u ’nin alacağı büyük değer, F değerinin de büyük olma eğiliminde olduğu
anlamına gelir. Buna göre F-testi istatistik değeri 0.01 ve 0.05 için v; n-k serbestlik
dereceli kritik değer cF ’den büyük olursa, temel hipotez reddedilir.
2X ve 2
2X değişkenleri satış modelinden çıkarılmalı mıdır yoksa modelde kalmalı
mıdır?’ın testi için F-testinin aşamaları aşağıdaki gibidir:
1. Temel ve alternatif hipotezi belirlenmesi: Birleşik temel hipotez ve alternatif
hipotez aşağıdaki gibidir.
0 2 3: 0 , 0H
1 2 3: 0 veya 0 H veya her ikisi de sıfır değil
veya
0 2 3: 0H
1 : Enaz biri sıfırdan farklı dır.H
2. Temel hipotez doğruysa, test istatistiği: 0H ’da iki kısıt olduğu için v=2’dir.
n=75 olduğuna göre, 0H doğru olduğu varsayımı altında F-testi istatistiğinin dağılımı
aşağıdaki gibidir.
2 2
2,712
ˆ ˆ 2
ˆ 75 4
KSL KSZ
KSZ
u uF F
u
3. Anlamlılık düzeyi oluşturularak red bölgesi belirlenir. Anlamlılık düzeyi 0.05
alınır ise 2,71F dağılımından elde edilen kritik değer,
0.95,2,71cF F olup, F’in red bölgesi ≥
3.126’dır.
4. Test istatistiğinin örnek değeri hesaplanır. F-testi istatistik değeri aşağıdaki gibidir.
1896.391 1532.084 2
8.441532.084 75 4
F
5. Karar aşaması: 8.44 3.126cF F olduğu için, 2 0 ve 3 0 olduğu temel
hipotezi reddedilir ve bunlardan en az birinin sıfırdan farklı olduğu sonucuna ulaşılır. Reklam,
satış hasılatı üzerinde anlamlı bir etkiye sahiptir.
269
10.3. Modelin Anlamlılığının Testi
F-testi için önemli bir uygulama, bir modelin genel anlamlılığının test edilmesidir.
Hatırlanacağı üzere toplam değişme içinde regresyonla açıklanan değişmenin payını gösteren
belirginlik katsayısı 2R ’nin bir istatistik olduğunu ve test edilmesi gerektiği ifade edilmişti. F-
testi ile bir modelin genel anlamlılığının test edilmesi esasen 2R ’nin testidir.
Bağımlı değişken Y’nin, belirli bir açıklayıcı değişken Xi ile ilişkili olup olmadığının
testi için t-testi kullanıldı. Şimdi bu test tüm açıklayıcı değişkenlerin anlamlılığının birleşik
testi için genişletilecektir. Tekrar, k sayıda parametre ve k-1 sayıda değişken için çok değişkenli
regresyon modelini aşağıdaki gibidir.
0 1 1 2 2 1 1i i i k ik iY X X X u
Uygun bir açıklayıcı modele sahip olup olmadığımız incelemek için, aşağıdaki temel ve
alternatif hipotezler kurulur.
0 1 2 1: 0kH
1; iH ’lerdan en az biri sıfırdan farklıdır. 1,2, , 1i k için,
Bu hipotezler aşağıda verilen temel ve alternatif hipotezlere denktir.
2
0 : 0H R
2
1; 0H R
Temel hipotez, k-1 bileşene sahip olduğu için, birleşik hipotezdir. Temel bileşik hipotez
0 otonom parametre hariç, i parametrelerinin her biri ve tümünün aynı zamanda sıfır
olduğunu göstermektedir. Eğer bu temel hipotez doğruysa, açıklayıcı değişkenlerin hiçbirisi
bağımlı değişken Y’yi etkilemez ve böylece, modelimizin çok az değeri vardır veya hiçbir
değeri yoktur. Eğer alternatif hipotez 1H doğruysa, parametrelerden en az biri sıfırdan farklıdır
ve böylece bir veya daha fazla açıklayıcı değişken modelde yer almaktadır. Ancak alternatif
hipotez, hangi değişkenlerin içerilebileceğini göstermez. Bu test ile uygun bir açıklayıcı modele
sahip olup olmadığımız test ettiğimiz için, bu test regresyon modelinin genel anlamlılığının testi
olarak da bilinmektedir. Sonuç olarak, tek bir temel hipotezi test etmek için t-testi kullanılmakta
iken, birleşik temel hipotezinin testi için F-testi kullanılmaktadır. Kısıtsız model
0 1 1 2 2 1 1i i i k ik iY X X X u
iken, temel hipotez doğru iken, kısıtlı model aşağıdaki gibi olacaktır.
0i iY u
Bu kısıtlı modelde 0 ’ın en küçük kareler tahmincisi aşağıdaki gibidir.
270
* 1ˆ
n
i
i
Y
Yn
Buna göre * , bağımlı değişkenin örnek ortalamasına eşittir. Bu 0i iY u bağımsız
değişkenlerden hiçbirinin yer almadığı model için hata karelerinin toplamı aşağıdaki gibidir.
2 2*
1 1
ˆn n
i i
i i
HKT Y Y Y BKT
Regresyonun anlamlılığının testi için test istatistiği aşağıdaki gibidir.
2 2
2
ˆ 1
ˆ
i i
i
y u kF
u n k
Bu test istatistiğinin hesaplanan değeri, 1,k n k
F
dağılımından elde edilen bir kritik
değer ile karşılaştırılır. Testin sonucu, regresyon analizi için temel öneme sahiptir.
Satış gelirleri uygulaması için regresyonun genel anlamlılığını testi, 1X ,
2X ve 2
2X
değişkenleri ile ilgili parametrelerin birlikte sıfır olup olmadığının, bu parametrelerden en az
birinin sıfırdan farklı olduğu alternatif hipotezine karşı testidir. Buna göre testin aşamaları
aşağıdaki gibidir.
1. 0 1 2 3: 0H
temel hipotezi
1 1 2 3; , , ' ün en az biri sıfırdan farklıdır.H
alternatif hipotezine karşı test edilmektedir.
2. 0H doğru ise, F test istatistiği aşağıdaki gibidir.
2 2
3,712
ˆ 4 1
ˆ 75 4
i i
i
y uF F
u
3. %5 anlamlılık düzeyini kullanarak, serbestlik derecesi (3, 71) ile, F-istatistiği için
kritik değerini 𝐹𝑐 = 2.734 buluruz. Böylece, 𝐹 ≥ 2.734 olursa, 𝐻0’ı reddederiz.
4. Gereken karelerin toplamı, 2 3115.482iy ve 2ˆ 1532.084iu ki bu F-değeri
aşağıdaki gibidir,
2 2
2
ˆ 1 3115.482 1532.084 4 124.459
ˆ 1532.084 75 4
i i
i
y u kF
u n k
271
5. 24.459 2.734 olduğu için, 𝐻0 reddederiz ve tahmin edilen ilişki anlamlı bir
ilişkidir. Fiyat, satışlar ve satışların karesinin en azından biri satışlar üzerinde bir etkiye sahip
olduğuğ sonucuna ulaşırız.
10.3. F- ve t- Testleri Arasındaki İlişki
Yukarıda2 0 ve
3 0 olup olmadığını test etmek için bir F-testi kullanarak,
reklamın, satışları etkileyip etkilemediğini test ettik.
2
0 1 1 2 2 3 2i i i i iY X X X u
Varsayalım ki, şimdi, fiyatların satışları etkileyip etkilemediğini test etmek istiyoruz.
Yukarıda uyguladığımız F-testinin aşamalarını aynı şekilde uygulayacağız.
0 1 1 1: 0 , : 0H H ve kısıtlı model aşağıdaki gibidir,
2
0 2 2 3 2i i i iY X X u
Kısıtlı ve kısıtsız model tahmin edilerek her iki model için de kalıntı kareler toplamı
hesaplanır. Bunlar sırasıyla, ˆ 1532.084KSZ
u ve ˆ 2683.411KSL
u ′e eşittir.
Gerekli F-değeri aşağıdaki gibidir,
2 2
2
ˆ ˆ 2683.411 1532.084 153.355
1532.084ˆ
KSL KSZ
KSZ
u u vF
u n k
%5 kritik değer, 0.95,71
3.976cF F ’dır. 53.355 3.976cF F böylece,
0 1: 0H reddedilir.
Tek bir “eşitlik” temel hipotezini ( tek bir kısıtlama), “eşit değildir” alternatif hipotezine
karşı test ederken, ya t-testi ya da F-testi kullanılabilir; bu test sonuçları özdeş olacaktır. Bu
uyumun sebebi, t- ve F-dağılımları arasındaki tam ilişkidir. df serbestlik derecesi ile t rassal
değişkenin karesi, paydaki 1 serbestlik derece ile ve paydadaki df serbestlik derece ile bir F
rassal değişkenidir. 𝐹(1,𝑑𝑓) dağılımına sahiptir.
t-testini ile 0 1: 0H karşı
1 1: 0H test etmek için aşağıda raporlanmış tahmin
sonuçları kullanılmaktadır.
2
1 2 2109.72 7.640 12.151 2.768
ˆ( ) (6.80) (1.046) (3.556) (0.941)
i i i i
i
Y X X X
Se
0 1: 0H karşı 1 1: 0H test için t-değeri, 7.640 1.046 7.30444t ’dür. Bunun
karesi, 22 7.30444 53.355t dir ki bu değer, yukarda hesaplana F-değeri ile aynıdır. t-testi
272
için %5 kritik değer, 𝑡𝑐 = 𝑡(0.95,2,71) = 1.9939 olup, karesi, 𝑡𝑐2 = 1.99392 = 3.976 = 𝐹𝑐, -ki
bu F-testi için kritik değerdir. Bu tam ilişkiler sebebiyle, kullandığımız yaklaşım ne olursa
olsun, her zaman aynı sonuca ulaşacağımız anlamına gelir. Ne var ki, tek-kuyruklu t-test
kullanırken, eşdeğerlik yoktur çünkü alternatif hipotez, > veya < gibi bir eşitsizlik olduğunda
F-testi, uygun değildir. t-testleri ve F-testleri arasındaki özdeşlik, temel hipotez, tek bir kısıttan
fazlasından oluştuğunda devam etmez. Bu şartlar altında, 𝑣 ≥ 2, t-testi kullanılamaz, fakat F-
testi mevcuttur.
F-testinin bileşenleri aşağıdaki gibi özetlenebilir:
1. Temel hipotez 𝐻0 , model parametreleri 𝛽𝑖 üzerine bir veya daha fazla eşitlik
kısıtlarından oluşur. Kısıt sayısı, v ile gösterilir. v= 1 olduğunda, temel hipotez, tekli
temel hipotez olarak isimlendirilir. v≥ 2 olduğunda, birleşik temel hipotez olarak
isimlendirilir. Temel hipotez, herhangi “daha büyük veya eşittir” veya “ daha küçük
veya eşittir” hipotezlerini içermeyebilir.
2. Alternatif hipotez, temel hipotezde bir veya daha fazla eşitliklerin doğru olmadığını
ifade eder. Alternatif hipotez, herhangi bir “daha büyük” veya “ daha küçük”
seçeneklerini içermeyebilir.
3. Test istatistiği, F-istatistiğidir.
4. Temel hipotez doğruysa, F, paydaki vserbestlik derecesi ve paydadaki n-k serbestlik
derecesi ile F-dağılımına sahiptir. Temel hipotez, 𝐹 > 𝐹𝑐 olursa, reddedilir, burada
𝐹 = 𝐹(1−𝛼,𝑣,𝑛−𝑘) , F-dağılımının üst kuyruğında olasılık yüzdesini 𝛼 bırakan kritik
değerdir.
5. Tek bir eşitlik temel hipotezini test eerken, ya t- veya F-testi posedürünü kullanmak
mükemmel bir şekilde doğrudur: Bunlar eşittirler. Uygulamada, tekli kısıtlarını test
etmek için, t-testi kullanımı yaygındır. F-testi genelde, birleşik hipotezler için
kullanılır.
10.4. Varyans Analiz (ANOVA) Tablosu
Özellikle çok değişkenli regresyon modelleri açısından önemli olan analizi yaklaşımı
aynı verilere uygulanan alternatif modellerin seçiminde yol göstericidir. Aynı zamanda
belirginlik katsayısı, tahminin standart hatası, bağımlı değişkenin koşulsuz varyansı gibi
ölçülerin varyans analiz tablosunda hesaplanması mümkündür. Varyans analiz tablosunun
oluşturulmasındaki amaç regresyon ile açıklanan değişim anlamını test etmektir. Varyans
analiz tablosunu oluşturmak için toplam değişme, regresyon ile açıklanan değişme ve regresyon
ile açıklanamayan değişme arasındaki ilişkiyi bir kez daha yazalım.
2 22 ˆ ˆ
i i i iY Y Y Y Y Y
veya
2 2 2ˆ ˆi i iy y u
273
BKT RKT HKT
Yukarıdaki değişimler ile ilgili unsurlar kullanılarak varyans analiz tablosu oluşturulur.
Değişimin
Kaynağı
Kareler Toplamı
KT
Serbestlik derecesi
sd
Ortalama
Kareler Toplamı
OKT
RKT 2ˆiy k-1 2ˆ 1iy k
HKT 2ˆiu n-k 2ˆ
iu n k
BKT 2
iy n-1 2 1iy n
Tablo: Varyans analiz (ANOVA) tablosu
Varyans analiz tablosunu kullanarak regresyon ile açıklanan değişmenin anlamlık testi
için aşamalar aşağıdaki gibidir.
1. Temel ve alternatif hipotezler aşağıdaki gibi kurulur.
0 1 2 1: 0, 0, , 0kH
1; iH ’lerdan en az biri sıfırdan farklıdır. 1,2, , 1i k veya
2
0 : 0H R
2
1; 0H R
2. 0H doğru ise test istatistiği aşağıdaki gibidir.
2
1,2
ˆ 1' nın
ˆ' nın
i
k n k
i
y kRHK OKTF F
KHT OKT u n k
3. Verilen bir anlamlılık düzeyini kullanarak 1,k n k serbestlik derecesi ile F-
istatistiği için kritik değerinicF bulunur.
4. Örnek verilerinden F değeri hesaplanır.
5. cF F olursa, 𝐻0 ’ı reddederiz. Böylece regresyon modelinde yer alan bağımsız
değişkenler değişkenler bağımlı değişken Y’yi açıklamada istatistiksel açıdan anlamlıdır.
Ayrıca yukarıdaki gibi hazırlamış ANOVA tablosunun Birici sütunun ilk satırının (2ˆiy ) üçüncü satıra ( 2
iy ) oranından belirginlik katsayısı elde edilir. İkinci satırın son
elemanı ( 2ˆiu n k ) tahminin standart hatasını verir. Üçüncü satırın son elemanı (
2 1iy n ) bağımlı değişkenin koşulsuz varyansıdır. ANOVA tablosunu üçüncü sütunun
birinci ikinci sıra unsurlarının oranı ise hesaplanan F değeridir.
274
Açıklayıcı Uygulama: Tüketim Modeli
Örneklem 1 verileri kullanılarak aşağıdaki ara sonuçlar kullanılarak;
n=10 1211Y 1700iX 2 322000iX 226020i iY X 170X 121.1Y
2 33000ix 2 12926.9y 20150i iy x
aşağıdaki regresyon modeli tahmin edilmişti.
ˆ 17.29 0.61i iY X
Şimdi yukarıdaki ara sonuçlar ve tahmin edilen regresyon modeli kullanılarak ANOVA
tablosunu düzenleyecek ve bu tablodan çıkarımlar elde edeceğiz. Öncelikle teorik varyans
analiz tablosunu aşağıdaki gibi hazırlıyoruz.
Değişimin
Kaynağı
Kareler Toplamı
KT
Serbestlik derecesi
sd
Ortalama
Kareler Toplamı
OKT
RKT 2ˆiy k-1 2ˆ 1iy k
HKT 2ˆiu n-k 2ˆ
iu n k
BKT 2
iy n-1 2 1iy n
Öncelikle yukarıdaki verileri kullanarak kareler toplamları hesaplanır.
BKT= 2 12926.9y ara sonuçlarda verilmiş,
Basit regresyonda regresyonla açıklanan kareler toplamı
RKT= 22 2 2ˆˆ 0.61 33000 12279.3i iy x
Not: Model k değişkenli model olsa idi, regresyon ile açıklanan değişmenin
2
1 1 2 2ˆ ˆ ˆˆ
i k ky x y x y x y eşitliğinden hesaplanması gerektiğini hatırlayın.
Buradan kalıntı kareler toplamı
BKT-RKT=HKT= 2ˆ 12926.9 12279. 647.63iu
olarak hesaplanır. k=4 , n=10 olduğuna göre varyans analiz tablosu aşağıdaki gibi düzenlenir.
275
Değişimin
Kaynağı
Kareler Toplamı
KT
Serbestlik derecesi
sd
Ortalama
Kareler Toplamı OKT
RKT 12279.3 2-1=1 12279.3 1 12279.3
HKT 647.6 10-2=8 647.6 8 80.95
BKT 12926.9 10-1=9 1 1436.3222926.9 9
Düzenlenen bu varyans analiz tablosundan aşağıdaki sonuçlara ulaşabiliriz.
1. Hata terimi varyansının tahmini: 2 2ˆ ˆ 80.95iu n k
2. Belirginlik katsayısı: 2 2 2 12279.3ˆ 12926.9 0.95i ir y y
veya
2 2 2ˆ1 1 647.6 12926.9 0.95i ir u y
3. Bağımlı değişken Y’nin koşulsuz varyansı
Var(Y)=1436.322
4. Regresyonun anlamlılığını ( 2r ’nin anlamlılığını) test edebiliriz.
Temel ve alternatif hipotezler
0 1
1 1
: 0
: 0
H
H
veya
2
0
2
1
: 0
: 0
H r
H r
Test istatistiği
2
1,2
ˆ 1
ˆ
i
k n k
i
y kF F
u n k
olduğuna göre varyans analiz tablosunun son sütunu kullanılarak F istatistiğinin değeri
hesaplanır ve tablo değeri ile karşılaştırılır.
0.05,1,8151.6
12279.3
80.9899 5.32
5F F
Bu sonuca göre 1H hipotezi kabul edilir ve regresyon ile açıklanan değişme
veya 2r istatistiksel açıdan anlamlıdır. Gelir tüketim üzerinde etkilidir.
276
Uygulamalar
277
Uygulama Soruları
1) Aşağıda ara sonuçları kullanarak kısıtlı ve kısıtsız modelin hangisinin uygun model
olduğuna karar veriniz?
1 2ˆ 2.301 7.20 3.91i i iY X X
2 0.884R
2ˆ 945KSLy 2ˆ 233KSLu n=35
1 2 3 4ˆ 14.82 4.08 2.954 0.105 0.529i i i i iY X X X X
2 0.898R 2ˆ 973KSZy
2ˆ 105KSZu
Öncelikle bileşik temel ve alternatif hipotez aşağıdaki gibi belirlenir.
0 3 4: 0 , 0H
1 3 4: 0 veya 0 H veya her ikisi de sıfır değil
Temel hipotez doğruysa, test istatistiği: 0H ’da iki kısıt olduğu için v=2’dir. n=35
olduğuna göre, 0H doğru olduğu varsayımı altında F-testi istatistiğinin dağılımı aşağıdaki
gibidir.
,
ˆ ˆ
ˆ
KSL KSZ
v n k
KSZ
u u vF F
u n k
Test istatistiğinin örnek değeri hesaplanır. F-testinin istatistik değeri aşağıdaki gibidir.
233 105 2
105 421.3333
0 53F
Anlamlılık düzeyi 0.05 alınır ise 2,30
F dağılımından elde edilen kritik değer,
0.95,2,30cF F olup, F’in red bölgesi ≥ 3.32’dir. 21.33 3.126cF F olduğu için, 4 0 ve
5 0 olduğu temel hipotezi reddedilir ve bunlardan en az birinin sıfırdan farklı olduğu
sonucuna ulaşılır. Kısıtsız model Y bağımlı değişkenini açıklamada kısıtsız modele tercih
edilir.
278
2) Önceki derslerimizde İthalatın, GSMH ve ithal malları fiyat indeksinin
fonksiyonu olduğu model aşağıdaki ara sonuçlardan
1 1 1
2 2 2
2 22
22 2 2
1 1 1
22 2 2
2 2 2
1 2 1 2 1 2
280 4 15 4 40
36 4 2 4 20
84 4 4 20
984 4 15 84
18 4 2 2
130 4 15 2 10
i i i i
i i i i
ii
i i
i i
i i i i
y x Y X nX Y
y x Y X nX Y
y Y nY
x X nX
x X nX
x x X X nX X
2
1 2ˆ ˆ2.94 0.58 0.94 0.2408i iY X X u
olarak tahmin edilmişti. Regresyon ile açıklanan değişmenin anlamlılığını test edelim.
Öncelikle temel ve alternatif hipotezler aşağıdaki gibi kurulur.
0 1 2: 0H
1 1 2; , 'nin en az biri sıfırdan farklıdır.H
0H doğru ise, F test istatistiği aşağıdaki gibidir.
2 2
1,2
ˆ 1
ˆ
i i
k n k
i
y u kF F
u n k
%5 anlamlılık düzeyini kullanarak, k-1=3-1=2 ve n-k=4-3=1 ‘den (2,1) serbestlik derecesi ile
200cF ‘e eşittir.
Gereken karelerin toplamı, 2 20iy ve 2ˆ 0.2408iu ki bu F-değeri aşağıdaki gibi
hesaplanır.,
20 0.2408 3 1
0.2408 4 1123.0847F
123.0847 200 olduğu için, 𝐻0 reddedilemez ve tahmin edilen ilişki istatistiksel
olarak anlamlı değildir. İktisat teorisine göre ithalat, GSMH ve İthal malları fiyat endeksinin
fonkiyonu olmasına rağmen bu uygulamada GSMH ve İthal malları fiyat endeksi ithalatı
açıklamada yetersiz kalmışlardır. Bunun nedeni daha önce ifade edildiği üzere gözlem sayısının
4 ile sınrlı tutulmuş olmasıdır.
279
3-10 arası sorular aşağıdaki varyans analiz tablosu (ANOVA) kullanılarak
cevaplandırılacaktır.
ˆ 13.89 92.47i iY X
Değişimin
Kaynağı
Kareler Toplamı
KT
Serbestlik derecesi
sd
Ortalama
Kareler Toplamı
OKT
RKT 8552.73 1 8552.73
HKT 337.27 8 42.159
BKT 8890.00 9 987.7778
3) Belirginlik katsayısını hesaplayınız.
2 855 . 3ˆ 2 7iy ve 2 8890iy olarak verildiğine göre
2
2
2
8552.730.96
8890
ˆi
i
yr
y
Bağımlı değişkendeki toplam değişmenin %96 sı X bağımsız değişkeni tarafından
açıklanmaktadır.
4) Hata terimi varyansını tahmini nedir? 2 42 59ˆ .1
5) Bağımlı değişkenin koşulsuz varyansı nedir?
( ) 987.7778Var Y
6) Tahminin standart hatası nedir?
42. 59ˆ 1 6.49
7) Regresyon ile açıklanan değişmenin ( 2r ’nin) anlamlılığını test edin.
Temel ve alternatif hipotezler
0 1: 0H
1 1: 0H
Test istatistiğinin değeri
2 2
2
8890.00 337.27ˆ 1 2202
1
ˆ.8696
337.2 0 27 1
i i
i
y u kF
u n k
0.01 için kritik değer 1,8
11.3cF F ’dür
280
202.87 11.3cF F olduğu için 0H hipotezi reddedilir. Regresyon ile açıklanan
değişme ( 2r ) istatistiksel açıdan anlamlı bulunmuştur.
8) X katsayısı için t- testi uygulamaya gerek var mıdır?
Basit regresyon için t-testi ile F-testi birbielerine alternatif testler olup aynı sonucu verir.
Dolayısıyla ayrıca t-testi uygulamaya gerek yoktur.
9) F-istatistiğinin hesaplanmış değerinden t-istatistiğinin değerini bulabilirmisiniz?
2F t eşitliğinden
2202.87 t
t-istatistiğinin değeri aşağıda verilmiştir.
14.24t
10) 1 parametresinin standart hatasını hesaplayabilir misiniz?
Evet hesaplayabiliriz. t-istatistiği
1
1
ˆ
ˆt
Se
olduğuna göre,
1
92.4714.24
ˆSe eşitliğinden,
1ˆ 6.49368Se olarak bulunur.
281
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde Kısıtlı ve kısıtsız model arasında F – testini kullanarak nasıl tercih
yapacağımızı, bu bağlamda bileşik hipotezin ne olduğunu öğrendik. Daha önceki derslerimizde
belirginlik katsayısının bir istatistik olduğunu, yüksek belirginlik katsayısının regresyon
doğrusuna uyumunun iyi olduğu anlamına gelmediğini ve test edilmesi gerektiği üzerinde
durmuştuk. Bu dersimizde belirginlik katsayısının diğer bir ifade ile regresyon ile açıklanan
değişmenin anlamlılığının testini gördük. Ayrıca varyans analiz tablosunun nasıl
düzenlendiğini ve varyans analiz tablosundan belirginlik katsayısı, hata terimi varyansı, bağımlı
değişkenin koşulsuz varyansının hesaplanması ve regresyon ile açıklanan değişmenin nasıl test
edileceği üzerinde durduk. Basit regresyon modelinde t testi ile F testinin birbirlerine alternatif
testler olduğunu ve F-testi uygulanmış ise, ayrıca t- testini uygulamaya gerek olmadığını
gösterdik.
282
Bölüm Soruları
14 gözlemlik verilere ilişkin ara sonuçlar, regresyon modelinin tahmini aşağıda verilmiştir.
1 2ˆ 24.7747 2.9415 0.0424i i iY X X
2
5937iY Y , 2
ˆ 5257iY Y
1-10 arası sorular yukarıdaki veriler kullanılarak cevaplandırılacaktır.
1) Varyans analiz tablosunu düzenleyiniz.
Değişimin
Kaynağı
Kareler Toplamı
KT
Serbestlik derecesi
sd
Ortalama
Kareler Toplamı
OKT
RKT
HKT
BKT
2) Ana kütle hata teriminin varyansı nedir?
a) 2628.5
b) 61.82
c) 456.6923
d) 42.52
e) 73.80
3) Belirginlik katsayısı nedir?
a) 0.12
b) 0.72
c) 0.89
d) 0.05
e) 0.57
283
4) Hata terimi varyansının tahmini nedir?
a) 61.82
b) 680
c) 2628.5
d) 456.69
e) 5937
5) Sırasıyla toplam değişme, regresyonla açıklanan değişme ve regresyon ile
açıklanamayan değişmenin değeri nedir?
a) 5257, 680, 5937
b) 680, 5257, 5937
c) 5937, 680, 5257
d) 5937, 5257, 680
e) 680, 5937, 5257
6) Regresyon ile açıklanan değişmenin anlamlığının testi için temel ve alternatif
hipotezler hangisidir?
a) 0 1 2: 0H
1 1 2; , 'nin en az biri sıfırdan farklıdır.H
b) 0 0 1 2: 0H
1 0 1 2; , , 'nin en az biri sıfırdan farklıdır.H
c) 0 0 1 2: , , 'nin en az biri sıfırdan farklıdırH
1;.H 0 1 2 0
d) 0 1 2: , 'nin en az biri sıfırdan farklıdırH
1;H 1 2 0
e) 0 1 2:H
1 1 2; , 'nin en az biri sıfırdan farklıdır.H
284
7) Regresyon ile açıklanan değişmenin sırasıyla serbestlik derecesi, F-istatistiğinin
değeri, 0.05 anlamlılık düzeyinde kritik değer ve karar nedir?
a) (2,11) ; 42.52; 3.98 ; 1H kabul
b) (2,11) ; 5.76; 19.4 ; 0H kabul
c) (2,11) ; 5.76; 19.4 ; 1H kabul
d) (2,11) ; 42.52; 3.98 ; 0H kabul
e) (11,13) ; 0.14; 2.79 ; 0H kabul
8) Yukarıdaki regresyon modeline 3 4 5, ,X X X ilave ediliyor ve kalıntı kareler
toplamı 220 hesaplanıyor. Kısıtlı ve kısıtsız modeller için temel ve alternatif
hipotezler aşağıdakilerden hangisidir.
a) 0 0 1 2: 0H
1 0 1 2; , , 'nin en az biri sıfırdan farklıdır.H
b) 0 3 4 5: 0H
1 3 4 5; , , 'nin en az biri sıfırdan farklıdır.H
c) 2
0 : 0H R
2
1 : 0H R
d) 0 0 1 2:H
1 0 1 2: 0H
e) 0 3 4 5: 0H
1 3 4 5: 0.H
9) 8. Sorudaki veriyi de kullanarak kısıtlı model ve kısıtsız modelden hangisini
seçeceğiniz hususunda serbestlik derecesi, test istatistiğinin değeri, 0.05
anlamlılık düzeyinde kritik değer ve karar nedir?
a) (3,11) ; 10.67; 8.76; 1H Kabul
b) (6,8) ; 3.98; 4.15; 0H Kabul
c) (8,6) ; 11.09; 4.15; 1H Kabul
d) (3,8) ; 8.36; 8.85; 0H Kabul
e) (3,11) ; 5.98; 8.76; 0H Kabul
285
10) Aşağıdaki ifadelerden hangisi yanlıştır.
a) Birden fazla hipotezin birlikte testi bileşik test olarak adlandırılır.
b) Regresyonla açıklanamayan değişmenin testi belirginlik katsayısının testine
denktir.
c) Basit regresyon için t- testi ile F- testi sonucu aynıdır.
d) Basit regresyon için t-istatistiği değerinin karesi F-istatistiğinin değerine eşittir.
e) Varyans analiz tablosu ile regresyon ile açıklanan değişmenin anlamlılığı test
edilebilir.
Cevaplar
1) c
2) b
3) c
4) a
5) d
6) a
7) d
8) b
9) d
10) b
286
11. OTOKORELASYON
287
Bu Bölümde Neler Öğreneceğiz?
11.1. Otokorelasyon nedir?
11.2. Otokorelasyonun sebepleri
11.3. Otokorelasyonun sonuçları
11.4. Otokorelasyonun test edilmesi
288
Bölüm Hakkında İlgi Oluşturan Sorular
1) Otokorelasyon nedir?
2) Otokorelasyonun varlığında EKK tahmincilerin özellikleri nedir?
3) Otokorelasyon nasıl tespit edilir?
289
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde
edileceği veya geliştirileceği
Otokorelasyon
nedir?
Otokorelasyonun ne anlama geldiğini ve
otokorelasyonun varlığı halınde EKK
tahmincilerinin özelliklerini kavramak
Ders notları
Otokorelasyonun
test edilmesi
Durbin Watson testini uygulabilmek Ders notları, uygulamaları
tekrar etmeli
Otokorelasyonun
test edilmesi
Durbin-h testini uygulabilmek Ders notları, uygulamaları
tekrar etmeli
Otokorelasyonun
test edilmesi
Durbin’in Alternatif testini uygulabilmek Ders notları, uygulamaları
tekrar etmeli
Otokorelasyonun
test edilmesi
Sıra testini uygulabilmek Ders notları, uygulamaları
tekrar etmeli
Otokorelasyonun
test edilmesi
Breusch-Godfey Testini uygulayabilmek Ders notları, uygulamaları
tekrar etmeli
290
Anahtar Kavramlar
Yardımcı regresyon
Otokorelasyon
Durbin Watson testi
Durbin h testi
Durbin’in alternatif testi
sıra testi, Breusch-Godfey Testi
1. dereceden otokorelasyon
p.dereceden otokorelasyon
291
Giriş
Klasik doğrusal regresyon modelinin temel varsayımlarından biri rassal hata
terimlerinin birbirleriyle ilişkisiz olmasıdır. Özellikle zaman serisi verilerin kullanıldığı
modellerde karşılaşılan otokorelasyon ekonometrinin hızla gelişen zaman serleri analizine
temel teşkil eder. Kesit verilerinin kullanıldığı modellerde verilerin dizilişi herhangi bir sıra
takip etmediği için otokorelasyon sorunu, bu tür veriler ile çok fazla ilgili değildir.
Otokorelasyon daha önce ele aldığımız model kurma hatası, değişen varyans gibi varsayımdan
sapma olduğu için tahmin edilen modelin aleyhine sonuçlar doğurur. Bu dersimizde
otokorelasyonun sonuçları verilecek, otokorelasyonun tespiti için kullanılan testlerden bazıları
tanıtılacak ve otokorelasyonun varlığının tespit edilmesi durumunda modelin tahmini için
kullanılacak tahmin yöntemleri verilecektir.
292
11.1. Otokorelasyon Nedir?
Klasik doğrusal regresyon modelinin temel varsayımlarında biri hata terimleri arasında
ilişkinin olmamasıdır ve aşağıdaki gibi gösterilir.
, , , 0i j i j i jE u u X X E u u i j
Herhangi bir gözleme ait hata terimi başka bir gözleme ait hata terimini etkiliyorsa temel
varsayımdan sapma söz konusu olup, modelde otokorelasyon sorunu vardır.
, 0i jE u u i j
Genellikle zaman serisi verilerinin kullanıldığı modellerde karşılaşılan otokorelasyon
problemine,
- Model dışında bırakılan bağımsız değişken
- Modelin fonksiyonel biçiminin yanlış belirlenmesi
- Gecikmeli ilişkiler
- Konjonktür ve şok etkisi
neden olmaktadır.
Hata terimleri arasında 1. dereceden otokorelasyon
1t t tu u v
ile gösterilir ve kısaca AR(1) ile ifade edilir. AR(1) modelde bir dönem önceki hata
terimi cari dönem hata terimini etkilemektedir. Ana kütle otokorelasyon katsayısı ( )
1 1
1
t t t t
t t
E u E u u E u
Var u Var u
ile gösterilir. Klasik doğrusal regressyon modelinin temel varsayımlarından ilki hata
teriminin beklenen değeri sıfıra eşitliği bilindiğine göre
1 0t tE u E u
eşitliğini yazabiliriz. Ayrıca yine klasik doğrusal regresyon modelinin varsayımlarından
biri önceki bölümde detaylı ele alınan hata terimi varyansının gözlemler itibariyle sabit
olduğudur. Buna göre aşağıdki eşitliği yazabiliriz.
1t tVar u Var u
Böylece ana kütle otokorelasyon katsayısı
1
1
,t t
t
E u u
Var u
293
AR(1) modelin eğim katsayısıdır ve 1 1 arasında değer alır.
Bu bağlamda AR(2) model aşağıdaki gibi gösterilir.
1 1 2 2t t t tu u u v
AR(2) modelde hata terimi bir ve iki dönem önceki değerleri ile ilişkilidir. Genel olarak
AR(p) ise,
1 1 2 2t t t p t p tu u u u v
ile sembolize edilir.
11.2. En Küçük Kareler Tahmincileri İçin Otokorelasyonun Sonuçları
Otokorelasyonun varlığı halinde EKK tahmincileri sapmasız, tutarlı ancak en küçük
varyanslı değildir. Ana kütle hata teriminin varyansının tahmini ( 2 2ˆ ˆtu n k )
olduğundan küçük tahmin edilmiştir. Tahmin edilen parametreler sapmasız olmasına karşın
parametrelerin varyanslarının tahmini sapmalıdır. Belirginlik katsayısı olduğundan büyüktür. t-
ve F testleri artık geçersizdir. Bu testler otokorelasyonun varlığı halinde tahmin edilen
parametrelerin istatistiksel açıdan anlamlılıkları hususunda ciddi yanıltıcı sonuçlar verecektir.
11.3. Otokorelasyonun Tespit Edilmesi
11.3.1. Sistematik Olmayan Test: Kalıntı Grafikleri
Aşağıdaki şekilde kalıntı grafiklerine bakıldığında birincisinde pozitif ikincisinde
otokorelasyonun olduğu görülmektedir.
294
11.3.2. Sistematik Testler
11.3.2.1. Sıra (Run) Testi
Sıra testi tesadüfiliğin araştırılması için parametrik olmayan bir testtir. Tesadüfilik,
kalıntıların dizilişi ile ilgili bir kavramdır. Birbirini izleyecek şekilde ardarda dizilen veriler
tesadüfi iseler birbirlerini etkilemeyeceklerdir. Herhangi bir nedenle tesadüfi değil iseler,
birbirlerini etkileyeceklerdir.
Sıra testinin uygulama aşamaları aşağıdaki gibidir. İlk aşamada temel ve alternatif hipotez
aşağıdaki gibi oluşturulur.
0
1
: 0 (otokorelasyon yoktur)
: 0 (otokorelasyon vardır)
H
H
1n =( + ) işaretli kalıntı sayısı
2n = (- ) işaretli kalıntı sayısı
1 2n n n
k = birbirini takip eden işaret sayısı
olmak üzere >20n ise birbirini takip eden işaretlerin sayısı (k), aşağıdaki ortalama ve
varyansla normal dağılmaktadır.
Ortalama:
1 2 1 2
1 2
2 2 ( ) 1 1
n n n nE k
n n n
Varyans:
2 1 2 1 2 1 2 1 2 1 2
2 2
1 2 1 2
2 (2 - - ) 2 (2 - )
( ) ( -1) 1k
n n n n n n n n n n n
n n n n n n
Normal dağılımın özellikleri kullanılarak k ’nın güven aralığı aşağıdaki gibi
oluşturulur.
Prob 1.96 1.96 0.95k kE k k E k
Oluşturulan güven aralığının birbirini takip eden işaret sayısını ( k ) içerme olasılığı
%95’dir. k belirlenen sınırlar içerisinde ise, kalıntıların diziliş rassaldır, modelde
otokorelasyon yoktur.
295
Açıklayıcı Örnek
Tahmin edilen bir regresyon modelinden hesaplanan kalıntılar aşağıda verilmiştir. Sıra
testini uygulayarak otokorelasyonun varlığını araştıralım.
Yıllar 1980 1981 1982 1983 1984 1985 1986 1987
ˆiu -1.21 -1.12 -0.79 -1.14 -0.89 -1.42 -0.29 0.23
Yıllar 1988 1989 1990 1991 1992 1993 1994 1995
ˆiu 0.99 2.23 2.75 2.16 2.54 2.16 2.65 1.42
Yıllar 1996 1997 1998 1999 2000 2001 2002 2003
ˆiu 1.44 0.26 0.95 0.24 -2.04 -4.51 -2.87 -4.08
Temel ve alternatif hipotezler:
0
1
: 0 (otokorelasyon yoktur)
: 0 (otokorelasyon vardır)
H
H
Kalıntıların işaretleri sıralanır.
(- - - - - - -)(+ + + + + + + + + + + + +) (- - - -)
1 13 n (+) işaretli kalıntı sayısı
2 11 n (-) işaretli kalıntı sayısı
1 2 13 11 24 20n n n
(-), (+) ve (-) olmak üzere birbirini takip eden kalıntı işareti sayısı
3k
belirlendikten sonra 3k için ortalama ve varyansı hesaplayabiliriz.
1 2
1 2
2 2 13 11( ) 1 1
13 12.92
11
n nE k
n n
2 1 2 1 2 1 2
2
1 2 1 2
2
2 (2 - - )
( ) ( -1)
2 13 11 2 13 11 13 115,6561
13 11 13 11 1
k
n n n n n n
n n n n
2 5.6561 2.378k k
k için %95 güven aralığı oluşturulur.
Prob 1.96 1.96 0.95k kE k k E k
296
Prob 12.92 1.96 2.378 12.92 1.96 2.378 0.95k
12.92 1.96 2.378 (8.2593,17.5779)
3 k yukarıdaki aralığın dışındadır. Bu sonuca göre alternatif hipotez kabul edilir,
kalıntıların dizilişi rassal değildir ve modelde otokorelasyon vardır.
11.3.2.2. Durbin Watson Testi
Otokorelasyonun varlığını test etmek amacıyla kullanılan birçok test olmasına rağmen
en çok kullanılan Durbin-Watson (DW) testidir. Durbin-Watson testinin kullanılmasında dikkat
edilmesi gereken bazı durumlar mevcuttur, bunlar:
- Orijinden geçen regresyon modellerine DW testi uygulanmaz. Modelde bir
sabitin olması gerekmektedir.
- Testin uygulanabilmesi için hata terimleri arasında 1t t tu pu e-= + ile ifade
edilen birinci dereceden otokorelasyon AR(1) olması gerekmektedir.
.
- DW testi bağımlı değişkenin gecikmeli değerlerinin açıklayıcı değişken olarak
yer aldığı otoregresif modellerde kullanılamamaktadır. Aşağıda
0 1 1 2 2 3 4 5 11 1 2 1t t t t tt tY X X X X Y u
olarak ifade edilen modelde bağımlı değişkenin cari dönemdeki değeri ( tY ), bağımsız
değişkenlerin gecikmeli değerlerinin ( 1 1t
X
ve 2 1t
X
) yanı sıra kendi bir dönem önceki
değerinden (1tY ) de etkilenmektedir. Böyle bir model gecikmeli bir modeldir, fakat kendi
gecikmeli değeri de modelde bağımsız değişken olarak yer aldığından dolayı aynı zamanda
otoregresif bir modeldir. Modelde bağımlı değişkenin gecikmeli değerleri bulunuyorsa, diğer
bir ifade ile model otoregresif bir modelse bu durumda otokorelasyonun test edilebilmesi DW
testi kullanılamaz.
- DW testinin uygulanabilmesi için modellerde eksik gözlem olmamalıdır.
Durbin-Watson testi için temel ve alternatif hipotezler aşağıdaki gibidir.
0
1
: 0
: 0
H
H
297
DW test istatistiği ise
2
1
2
2
1
ˆ ˆ
ˆ
t n
t t
t
t n
t
t
u u
DW
u
veya
2 1DW p
ile verilir.
Otokorelasyon katsayısı p, -1 ile 1 arasında değer alır , 1 1p . Buradan hareketle
2 1DW p olduğuna göre,
1p ise, 4DW negatif otokorelasyon vardır.
0p ise 2DW = otokorelasyon yoktur.
1p ise 0DW pozitif otokorelasyonun vardır.
Buna bağlı olarak DW; 0 4DW aralığında değer alabilmektedir. Anlaşılacağı üzere
DW değerinin 2’ye yakın bir değer alması modelde otokorelasyon olmadığına işaret etmektedir.
DW test istatistiğinin değeri hesaplandıktan sonra alt sınır ( dL) ve üst sınır ( dU)
kritik değerlerin yer aldığı DW kritik değer tablosundan bulunarak karşılaştırma yapılır ve
otokorelasyonun varlığına varsa negatif mi yoksa pozitif mi olduğuna karar verilir. Kritik
değerlere bakılırken modelde yer alan bağımsız değişken sayısı ( 'k ) esas alınmaktadır.
Hesaplanan DW istatistiği değeri; ( dL) ( dU) değerleri arasına veya ( 4-dU) ile ( 4-dL) değerleri
arasına düşerse otokorelasyonun olup olmadığı konusunda karar verilemez. Bu değer aralıkları
kararsızlık bölgeleri olarak bilinir. Bu durumda alternatif otokorelasyon testleri kullanmamız
298
gerekmektedir. DW değeri; 0 ile ( dL) arasına düşerse otokorelasyon vardır ve pozitif
otokorelasyondur. Değer; ( 4-dL) ile 4 arasında ise yine otokorelasyon vardır fakat negatif
otokorelasyondur.
Açıklayıcı Örnek
50 gözlemlik verilerden aşağıdaki regresyon modeli tahmin edilmiş ve DW test
istatistiğinin hesaplanan değeri ise 1.43’e eşittir. DW testini kullanarak otokorelasyonun
varlığını test edelim.
1 2 3 4
ˆ 2.03 0.49 0.82 16.07 4.06tY X X X X
Temel ve alternatif hipotezler aşağıdaki gibi kurulur.
0 : 0H (Otokorelasyon yoktur.)
1 : 0 veya >0H (Pozitif otokorelasyon vardır.)
0.05 anlamlılık düzeyinde 4 bağımsız değişken sayısı ( ' 4k ) için kritik değerler
1.378Ld ve 1.721Ud ’e eşittir.
Hesaplanan DW değeri otokorelasyonun olmadığını ifade eden bölgeye düştüğü için H0
hipotezi reddedilemez. Modelde otokorelasyon yoktur.
11.3.2.3. Durbin-h testi
Daha önce de ifade edildiği gibi DW testi otoregresif modellerde kullanılamamaktadır.
Bağımlı değişkenin gecikmeli değerleri modelde bağımsız değişken olarak yer alıyorsa
299
otokorelasyonun varlığını tespit etmek amacıyla Durbin-h testi kullanılmaktadır. Durbin-h için
temel ve alternatif hipotezler aşağıda verilmiştir.
0 : 0H (Otokorelasyon yoktur)
1 : 0H (Otokorelasyon vardır)
Durbin-h test test istatistiği ise;
ˆ1
nh p
nVar
ile formüle edilir. Buradaki n gözlem sayısı, p otokorelasyon katsayısının tahmini,
( )ˆVar b ise bağımlı değişkenin gecikmeli değerine ait parametrenin varyansıdır.
Durbih – h istatistiğinin dağılımı asimptotik olarak normal dağılıma uygundur
ve bu test büyük örnekler için geçerlidir. Durbin h testi de DW testi gibi 1. dereceden
otokorelasyonun varlığının testinde kullanılır. Fakat ˆ.var( ) 1n b ³ ise bu test kullanılamaz.
Böyle bir durumda Durbin’in alternatif testi kullanılır. h istatistiği normal dağılıma uygun
olduğu için bir sonraki aşamada istatistik değeri 2Za değeri ile karşılaştırılır.
h istatistik değeri; 2Za± aralığında ise temel hipotez kabul edilir ve otokorelasyonun
olmadığına karar verilir. 2h Za> + ise pozitif otokorelasyon, 2h Za< - ise negatif
otokorelasyon var olduğu sonucuna varılır. Anlaşılacağı gibi son iki durumda H1 hipotezi kabul
edilmiştir.
Açıklayıcı Örnek
Aşağıda tahmin sonuçları verilen modelde otokorelasyonun varlığını test edelim.
1ˆ 0.759 14.58 1.17 2.90 31
ˆ( ) (0.88) (5.77) (0.081)
t t tY X Y DW n
Se
Model otoregresif bir model olduğu için, otokorelasyonun varlığının testi için DW testi
kullanılamaz, Durbin-h testini kullanmamız gerekmektedir.
300
Temel ve alternatif hipotezler yazılır.
0
1
: 0
: 0
H
H
Test istatistiği değerinin hesaplanabilmesi için,
ˆ1
nh p
nVar
öncelikle 2 1DW p ilişkisinden otokorelasyon katsayısının tahmini ( p
)değerinin elde edilmesi gerekir.
2 1DW p
2.90 2 1 0.45p p
Buradan hareketle h test istatistiğinin değeri elde edilir.
2
310.45 2.84
1 31 0.081h
Dikkat edileceği gibi gecikmeli değişkene ait parametrenin varyansını elde etmek için,
parametre standart hatasının(0.081)
karesi alınmıştır. Hesaplanan istatistik değeri
2.84 1.96- < - olduğu için modelde otokorelasyon vardır ve negatif otokorelasyondur.
11.3.2.4. Durbin’in Alternatif Testi
Otokorelasyonun varlığı araştırılan model, otoregresif bir model ise DW testi yerine
Durbin-h testinin kullanılması gerektiğini öğrenmiş bulunmaktayız. Ancak test istatistiğinde
yer alan ˆ 1nVar ise, kök içi negatif değer alacağı için Durbin h testi ile otokorelasyonun
varlığı araştırılamaz. Söz konusu durumda parametrik bir test Durbin’in alternatif testi
kullanılır. Durbin’in alternatif testinin aşamaları kısaca aşağıdaki gibidir.
Temel ve alternatif hipotezler yazılır.
301
0
1
: 0
: 0
H
H
Otokorelasyonun araştırıldığı modelin (0 1 2 1ˆ ˆ ˆˆ
t t tY X Y ) kalıntıları ( ˆtu )
hesaplanır ve kalıntıların bağımlı değişken olduğu yardımcı regresyon kurulur. Kalıntıların bir
dönem önceki değerlerine (1
ˆtu
) açıklayıcı değişken olarak yer aldığı yardımcı regresyon
aşağıda verilmiştir.
0 1 2 1 3 1
ˆ ˆt t t t tu X Y u v
Tahmin edilen yardımcı regresyonda 1
ˆtu
ile ˆtu arasında ilişki kuran
3 parametresi
istatistiksel açıdan anlamlı bulunursa, hata terimleri rasında birinci dereceden otokorelasyonun
varlığına karar verilir. 3 parametresinin anlamlılık testi için temel ve alternatif hipotezler;
0 3
1 3
: 0
: 0
H
H
Temel hipotezin doğru olduğu varsayımı altında test istatistiğinin verilen bir
anlamlılık düzeyinde n-k serbestlik derecesi ile t dağılımına uygunluk gösterdiği önceki
derslerimizden bilinmektedir. Aşağıda verilen test istatistiğinden
3
3
ˆ
ˆ n kt t
Se
hesaplanan değer, kritik değerden c n k
t t
büyük ise birinci dereceden
otokorelasyonun varlığını işaret eden alternatif hipotez kabul edilir.
Açıklayıcı Örnek
Aşağıda verilen modelde I yatırımları, GSYİH gayri safi yurt içi hasılayı, r faiz oranının
göstermektedir.
10.78 0.672 0.04 0.941 19
ˆ (0.002)(0.036) (0.0051) (0.2513) 2.18
t t t t
i
I GSYİH r I n
Se DW
Yatırım
fonksiyonunda otokorelasyonun varlığını araştıralım. Raporlanmış regresyon sonuçlarında DW
test istatistiğinin değeri verilmiş, ancak modelde 1tI açıklayıcı değişken rolü üstlendiği için
kullanılmaz. Durbin-h test istatistiğinin değerinin hesaplamadan önce ˆ 1nVar şartının
gerçekleşme durumunu araştıralım.
2ˆ 19 0.2513 1.20 1nVar
302
Otokorelasyon testi Durbin-h’ın da kullanılmayacağı anlaşılmıştır. Durbin’in alternatif
testinin kullanılması gerekir, bu amaçla kalıntılar elde edilir ve tahmin edilen regresyon modeli
aşağıda verilmiştir.
1 1
ˆ ˆ14.78 1.408 0.006 1.206 0.639
ˆ (0.00672)(0.006) (0.0001) (0.0913) (0.313)
t t t t t
i
u GSYİH r I u
Se
1ˆ
tu ’nın
katsayısı 4 ’ün anlamlılık testi için temel ve alternatif hipotezler kurulur.
0 4
1 4
: 0
: 0
H
H
Test istatistiğinin değeri hesaplanır.
4
19 5
4
ˆ
ˆt t
Se
4
4
ˆ 0.6392.0415
ˆ 0.313t
Se
Hesaplanan test istatistiğinin değeri, 0.05 anlamlılık düzeyinde 19-5=14 serbestlik derecesi ile
kritik değer 14 2.145c n k
t t t
’den küçüktür, 4 istatistiksel olarak anlamsızdır. Böylece
yatırım modelinde birinci dereceden otokorelasyonun varlığı reddedilir, temel hipotez kabul
edilir.
11.3.2.5. Breusch-Godfey Testi (LM Test)
Buraya kadar gördümüz otokorelasyon testleri hata terimleri arasında birinci dereceden
olduğu varsayılan otokorelasyonun varlığının araştırılmasına yönelikti. Ancak p. dereceden
otokorelasyonun varlığının testinde önceki testler kullanılmaz.
0 1 1 2 2 3 3t t t t tY X X X u modelinde p. dereceden otokorelasyonun testi için
Breusch-Godfey testi kullanılır. Testin aşamaları kısaca aşağıdaki gibidir.
Temel ve alternatif hipotezler kurulur.
0 1 2
1 1 2
: 0
: 0
p
p
H
H
Temel hipotez p. dereceden otokorelasyonun olmadığı, alternatif hipotez ise p.
dereceden otokorelasyonun olduğu anlamına gelir.
İkinci aşamada otokorelasyonun varlığının araştırıldığı modelin kalıntıları hesaplanır ve
bu kalıntıların bağımlı değişken olarak yer aldığı yardımcı regresyon tahmin edilir. Yardımcı
regresyonda otokorelasyonun varlığının araştırıldığı modeldeki bağımsız değişkenlerin yanı
sıra p gecikme için kalıntılar yer alır.
303
0 1 1 2 2 3 3 4 1 5 2ˆ ˆ ˆ ˆ
t t t t t t k t p tu X X X u u u v Yardımcı
Regresyon tahmin edilir ve belirginlik katsayısı hesaplanır. Gözlem sayısı ile belirginlik
katsayısının çarpımına eşit test istatistiği p serbestlik derecesi ile ki-kare dağılır.
2 2
pnR
Test istatistiğinin değeri verilen bir anlamlılık düzeyinde 2 2
c p değerinden büyük
ise modelde p. dereceden otokorelasyon olduğunu gösteren alternatif hipotez kabul edilir.
Açıklayıcı Örnek
0.89 0.1295t tY X modelinde ikinci dereceden otokorelasyonun varlığını
araştırmak amacıyla aşağıdaki yardımcı regresyon tahmin edilmiştir.
2
1 2ˆ ˆ ˆ1.27 0.597 5.3 8.1 21 0.72t t t tu X u u n R
Otokorelasyonun varlığı hakkında kararınız nedir?
Temel ve alternatif hipotezler:
0 1 2
1 1 2
: 0
: 0
H
H
Test istatistiğinin değeri:
2 21 0.72 15.12nR
0.05 anlamlılık düzeyinde tablo değeri 2 2
2 5.991c ’dir.
Test istatistiğinin hesaplanan değeri tablo değerinden büyük olduğu için 0H hipotezi
reddedilir, 1H hipotezi kabul edilir. Modelde 2. dereceden otokorelasyon vardır.
11.3.3. Otokorelasyonun Varlığı Durumunda Parametre Tahmin
Yöntemleri
Otokorelasyonun varlığı halinde kullanılacak parametre tahmin yöntemleri:
-Birinci derece farklar yöntemi
-Genelleştirilmiş farklar yöntemidir.
Bu dersimizde tahmin yöntemlerinin sadece neler olduğu verilmiştir. Bu konuda daha fazla
okuma yapmak isteyen öğrencilerimiz Ekonometri kitaplarına başvurabilir.
304
Uygulamalar
305
Uygulama Soruları
1) 2006:I-2012:IV dönemine ilişkin turizm gelirlerinin GSYİH’ya etkisinin
araştırıldığı regresyon modelinin tahmininden hesaplanan kalıntıların
işaretlerinin dizilişi aşağıdaki gibidir.
tu |
Otokorelasyonun varlığı hakkında ne söyleyebilirsiniz?
Kalıntıların işaretleri verildiğine göre sıra (run) testini uygulayabiliriz. Birinci
dereceden otokorlasyonun varlığının araştırıldığı sıra testinin temel ve alternatif hipotezler
aşağıda verilmiştir.
0
1
: 0
: 0
H
H
İkinci aşamada (+ ) ve (-) işaretli kalıntıların sayısı tespit edilir.
1 16 n (+) işaretli kalıntı sayısı
2 12 n (-) işaretli kalıntı sayısı
1 2 16 12 28 20n n n için sıra testi uygulanabilir.
Üçüncü aşamada 4k için ortalama ve varyans hesaplanır.
1 2
1 2
2 2 16 12( ) 1 1
16 1214.71429
n nE k
n n
2 1 2 1 2 1 2
2
1 2 1 2
2
2 (2 - - )
( ) ( -1)
2 16 12 2 16 12 16 12
16 12 16 12 16.45805
k
n n n n n n
n n n n
2 6.45805 2.5412k k
Dördüncü aşamada k için %95 güven aralığı oluşturulur.
14.71429 9.733534 19.69501.96 2.5412 ( , 4)
Son aşama karar aşamasıdır. 4 k yukarıdaki aralığın dışındadır. Bu sonuca göre
alternatif hipotez kabul edilir, kalıntıların dizilişi rassal değildir ve modelde 1.dereceden
otokorelasyon vardır.
306
2) Aşağıda sonuçları raporlanmış regresyon modeli ve otokorelasyonun varlığının
araştırılması amacıyla yardımcı regresyon modeli verilmiştir.
1 2 -1
2
0,89 1, 203 0,86 4,12
ˆ ( ) (1, 26) (0,89) (0,001) (1,02)
2,89 0,54 10
t t t t
i
Y X X Y
SE
DW R n
Yardımcı regresyon 2 2
1 2 -1 -1ˆ ˆ2,01 3,09 - 4,98 0,6 5,12 0,89
ˆ( )(1.94) (2.83) (3.65) (0.015) (4.81)
t t t t tu X X Y u R
Se
Otokorelasyonun varlığı hakkında karar veriniz.
Modelde bağımlıdeğişkenin gecikmeli değeri -1 tY yer aldığı için DW testi,
ˆ( ) 10 (1.02) 10.404 1nVar olduğu için Durbin-h testi de kullanılamaz. Yardımcı
regresyon sonuçlarından yararlanılarak Durbin’in alternatif testi kullanılmalıdır. Bu amaçla
1
ˆtu
’nın katsayısı 4 ’ün anlamlılık testi için
1ˆ
tu ’nın katsayısı
4 ’ün
anlamlılık testi için temel ve alternatif hipotezler kurulur.
0 4
1 4
: 0
: 0
H
H
Test istatistiğinin değeri hesaplanır.
4
10 5
4
ˆ
ˆt t
Se
4
4
ˆ 5.121.06
ˆ 4.81t
Se
Hesaplanan test istatistiğinin değeri, 0.05 anlamlılık düzeyinde 10-5=5 serbestlik
derecesi ile kritik değer 510 5
2.571ct t t
’den küçüktür, 4 istatistiksel olarak
anlamsızdır. Böylece birinci dereceden otokorelasyonun varlığı reddedilir, temel hipotez kabul
edilir.
3) Aşağıdaki verilen sonuçlara göre otokorelasyonun varlığı hakkında
ne söyleyebilirsiniz?
2 2
1
ˆ 20.858 1.942 17
ˆ ˆ ˆ23.491 42.140
t t
t t t
Y X n
u u u
Öncelikle DW test istatistiğinin hesaplanması gerekir.
307
2
1
2
ˆ ˆ 23.4910.557451
ˆ 42.140
t t
t
u uDW
u
Test istatistiğinin değeri 2’den küçüktür, otokorelasyon varsa negatif
otokorelasyondur. Buna göre temel ve alternatif hipotezler;
0
1
: 0
: 0 ( veya 0)
H
H
Durbin-Watson tablosundan 0.05 anlamlılık düzeyinde ' 1k için
1.133Ld , 1.381Ud ’e eşittir.
0.557451 1.133LDW d için modelde pozitif otokorelasyon vardır.
4) Aşağıdaki verilen sonuçlara göre otokorelasyonun varlığı hakkında ne
söyleyebilirsiniz?
1 2ˆ 0.61 1.049 0.065 10 3.39t t tY X X n DW
Test istatistiğinin değeri 2’den büyüktür, otokorelasyon varsa negatif
otokorelasyondur. Buna göre temel ve alternatif hipotezler;
0
1
: 0
: 0 ( veya 0)
H
H
Durbin-Watson tablosundan 0.01 anlamlılık düzeyinde ' 2k için
0.466Ld , 1.333Ud ’e eşittir. Negatif otokorelasyon araştırıldığı için 0.466Ld ,
1.333Ud ’un dönüşümleri kullanılır.
4 2.664 3.39 4 3.534U Ld DW d için modelde otokorelasyonun varlığı
veya yokluğu hakkında bir sonuca varılamaz.
5) Aşağıdaki verilen sonuçlara göre otokorelasyonun varlığı hakkında ne
söyleyebilirsiniz?
' 4( bağımsızdeğişkensayısı) 50 1.43 0.05k n DW
Test istatistiğinin değeri 2’den küçüktür, otokorelasyon varsa pozitif
otokorelasyondur. Buna göre temel ve alternatif hipotezler;
0
1
: 0
: 0 ( veya 0)
H
H
Durbin-Watson tablosundan 0.05 anlamlılık düzeyinde ' 4k için
0.38Ld , 1.72Ud ’e eşittir.
0.38 1.43 1.72L Ld DW d modelde otokorelasyonun varlığı veya
yokluğu hakkında bir sonuca varılamaz.
308
6) 13.89 0.95t tY X modelinde ikinci dereceden otokorelasyonun
varlığını araştırmak amacıyla aşağıdaki yardımcı regresyon tahmin edilmiştir.
2
1 2ˆ ˆ ˆ2.07 0.97 6.3 15.1 11 0.83t t t tu X u u n R
Otokorelasyonun varlığı hakkında kararınız nedir?
Temel ve alternatif hipotezler:
0 1 2
1 1 2
: 0
: 0
H
H
Test istatistiğinin değeri: 2 11 0.83 9.13nR
0.05 anlamlılık düzeyinde tablo değeri 2 2
2 5.991c ’dir.
Test istatistiğinin hesaplanan değeri tablo değerinden büyük olduğu için 0H hipotezi
reddedilir, 1H hipotezi kabul edilir. Modelde 2. dereceden otokorelasyon vardır.
7) Aşağıdakilerden hangisi doğrudur?
a) p=0.8 ise DW=0.5 ‘dir.
b) DW istatistiğinin değeri 2’den küçük ise pozitif otokorelasyon testi yapılır.
c) Ana kütle otokorelasyon katsayısı p ile gösterilir.
d) DW testi pozitif otokorelasyonun varlığını araştırır.
e) Sıra testi test istatistiği ki-kare dağılımına uygunluk gösterir.
8) Otokorelasyonun varlığı halinde tahmin edilen parametreler……,
parametrelerin varyansılarının tahmini……’dır.
a) En küçük değerli; en küçük değerli değil
b) Sapmasız ; sapmalı
c) Sapmalı sapmalı
d) Sapmasız; tutarsız
e) Sapmalı: sapmasız.
9) Aşağıdakilerden hangisi otokorelasyonun sembolik ifadesidir.
a) ( , ) 0i jE u u i j
b) ( , ) 0 1, ,i iE u u ı n
c) ( , ) 0i jE u u i j
d) ( , ) 0 1, ,i iE u u ı n
e) Hiçbiri
309
10) DW=2.18 ise aşağıdakilerdan hangisi doğrudur?
a) p= -0.09
b) Pozitif otokorelasyon testi yapılır.
c) Negatif otokorelasyon testi yapılır.
d) p= 1.04
e) p= 0.04
Cevaplar: 7.b), 8.b), 9.c), 10.b)
310
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde otokorelasyon konusun ele aldık. Otokorelasyonun hata terimleri arasında
ilişki olduğu anlamına geldiğini ve genellikle zaman serisi verilerinin kullanıldığı modellerde
karşılaşılan bir sorun olduğunu belirttik. Otokorelasyon tespiti için alternatif test istatistiklerini
tanıttık ve hangi şart altında kullanılabileceklerini açıkladık ve bu testlerle ilgili uygulamalar
yaptık. Otokorelasyonun varlığı halinde kullanılacak parametre tahmin yöntemlerinin neler
olduğunu verdik.
311
Bölüm Soruları
1) Aşağıda sonuçları raporlanan regresyon modelinde;
2
1 2
2
ˆ 8.79 0.69 0.02 0.84 0.98
ˆ ˆ(2.38)(0.04) (0.005) 2,53 20
t t t
i
Y X X DW R
Se n
0tokorelasyonun varlığını araştırmak amacıyla
2
1 2 -1ˆ ˆ2,01 3,09 -12,98 5,12 0,61t tu X X u R yardımcı regresyon tahmin
edilmiştir. Buna göre aşağıdakilerden hangisi yanlıştır?
a) Birinci dereceden otokorelasyonun varlığı araştırılmaktadır.
b) Test istatistiğinin değeri 12,2 ‘ye eşittir.
c) Test istatistiği 1 serbestlik derecesi ile ki-kare dağılımına uygunluk gösterir.
d) Test istatistiğinin değeri 5.99’dır.
e) Modelde otokorelasyon yoktur.
2) Aşağıdakilerden hangisi yanlıştır.
a) Modelde kesim (otonom) parametre yoksa otokorelasyonun tespiti amacıyla Durbin-
Watson testi uygulanamaz.
b) Durbin-Watson testi ile otokorelasyon katsayısı arasında 1 2p DW ile gösterilen
ilişki vardır.
c) Durbin-Watson testi parametrik bir testtir.
d) Durbin-Watson testi ile 1t t tu u v ile gösterilen birinci dereceden otokorelasyonun
varlığını araştırılır.
e) Durbin-Watson testi otoregresif modellere uygulamaz.
3) Otokorelasyonun varlığını araştırmak için kalıntıların işareti aşağıdaki gibi
sıralanmıştır.
tu |
Yukarıdaki verilere göre aşağıdakilerden hangisi yanlıştır?
a) Birbirini takip eden işaret sayısı 7k ’ye eşittir.
b) Test istatistiği normal dağılıma uygunluk gösterir.
c) (+) ˆiu sayısı 1 22n , (-) ˆ
iu sayısı 2 13n , 35n
d) Birbirini takip eden işaret sayısı oluşturulan güven aralığının içinde ise alternatif
hipotez kabul edilir.
e) 0 : 0H ,
1 : 0H
4) Aşağıdakilerden hangisi otokorelasyonun nedenlerinden biri değildir?
a) Hata terimlerinin birbirleriyle ilişkili olması
b) Modelin dışında bırakılan bağımsız değişken
c) Modelin fonksiyonel biçiminin yanlış belirlenmesi
d) Gecikmeli ilişkiler
e) Konjonktür ve şok etkisi
312
5) Aşağıda raporlanmış regresyon modeli tahminine göre,
2
1 1
2
ˆ 18.9 6.09 3.841 3.65 0.36
ˆ ˆ(4.08)(2.81) (1.058) 29.02 15
t t t
i
Y X Y DW R
Se n
aşağıdakilerden
hangisi doğrudur.
a) 3.65DW , 2’den büyük olduğu için DW testi ile negatif otokorelasyon testi yapılır.
b) Test istatistiği ki-kare dağılıma uygunluk gösterir.
c) Hipotez testleri 0 : 0H ,
1 : 0H
0 3: 0H ,
1 3: 0H
d) İkinci dereceden otokorelasyonun varlığı araştırılır.
e) Otokorelasyon katsayısının tahmini 0.54p ’e eşittir.
6) Aşağıdakilerden hangisi p. dereceden otokorelasyonun araştırılması ile ilgili
hipotezlerdir?
a) 0 1 2: pH , 0 1 2: pH
b) 0 1 2: 0pH p p p , 0 1 2: 0pH p p p
c) 0 : 0pH , 0 : 0pH
d) 0 1 2: 0pH , 0 1 2: 0pH
e) 0 1 2: ,pH p p p 0 1 2: pH p p p
7) Aşağıdaki verilen sonuçlara göre;
2 2
1
ˆ 12.709 0.624 15
ˆ ˆ ˆ4.91 5.87
t t
t t t
Y X n
u u u
Aşağıdakilerden hangisi yanlıştır?
a) Durbin Watson test istatistiği DW=0.84’ye eşittir.
b) Otokorelasyon katsayısının tahmini p=0.58’e eşittir.
c) Birinci dereceden otokorelasyonun varlığı araştırılmaktadır.
d) 0 : 0H p , 1 : 0 veya 0H p p
e) 0.05 anlamlılık düzeyinde 0.811Ld , 1.070Ud ’dir.
8) Otokorelasyonun varlığı halinde aşağıdaki ifadelerden hangisi doğrudur?
a) Tahmin edilen parametrelerin beklenen değeri ana kütle değerine eşit değildir.
b) Tahmin edilen parametreler en küçük varyanslı olma özelliğini devam ettirirler.
c) Hata teriminin varyansı olduğundan küçük tahmin edilmiştir.
d) Tahmin edilen prametreler etkinlik özelliklerini sürdürürler.
e) Belirginlik katsayısı etkilenmez.
313
9) Breusch-Godfey otokorelasyon testi için aşağıdaki ifadelerden hangisi
yanlıştır?
a) p. dereceden otokorelasyonun varlığını araştırmak amacıyla kullanılır.
b) Test istatistiği ki-kare dağılır.
c) Parametrik bir testtir.
d) Test istatistiğinin serbestlik derecesi tahmin edilen parametre sayısı k ‘dır.
e) Test istatistiği tablo değerinden büyük ise temel hipotez reddedilir, modelde p. dereceden
otokorelasyonun varlığı kabul edilir.
10) Aşağıdaki ifadelerden hangisi yanlıştır?
a) DW test istatistiğinin değeri 2’den büyük ise negatif otokorelasyon testi yapılır.
b) Durbin h test istatistiğinin değeri h, 2Z ’dan küçük ise negatif otokorelasyonun varlığı
söz konusudur.
c) p sıfır ise negatif otokorelasyon yoktur.
d) Sıra testi için güven aralığı aşağıdaki gibidir.
e) 2 2Prob 1.96 1.96 0.95k kE k k E k
Cevaplar
1) e
2) c
3) d
4) a
5) c
6) d
7) d
8) c
9) d
10) e
314
12. DEĞİŞEN VARYANS (HETEROSKEDASİTE)
315
Bu Bölümde Neler Öğreneceğiz?
12.1. Değişen Varyansın Yapısı
12.2. En Küçük Kareler Tahmincileri İçin Değişen Varyansın Sonuçları
12.3. Değişen Varyansın Tespit Edilmesi
12.4. Değişen Varyansın Varlığı Durumunda Parametre Tahmin Yöntemleri
316
Bölüm Hakkında İlgi Oluşturan Sorular
1) Değişen varyans nedir?
2) Modelde değişen varyans varsa, sonuçları nedir?
3) Değişen varyansı nasıl tespit edilir?
4) Değişen varyans sorunu varsa model hangi tahmin yöntemleri ile tahmin
edilmelidir?
317
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde edileceği
veya geliştirileceği
Değişen Varyansın
Yapısı
Değişen varyansı
tanımlayabilmeli Ders notları tekrar edilmeli,
Değişen Varyansın
Tespit Edilmesi Lagrange Çarpanı Testini
White Testini
Goldfeld-Quandt Testini
Spearman Sıra Korelasyon
Testini uygulayabilmek
Ders notları özümsenmeli
318
Anahtar Kavramlar
Değişen varyans
Sabit varyans
Varyans fonksiyonu
Kalıntı grafiği
Lagrange çarpanı testi
White testi
Goldfeld-Quandt Testi
Spearman Sıra Korelasyon Testi
319
Giriş
Klasik doğrusal regresyon modelinin temel varsayımlarından biri, ana kütle regresyon
fonksiyonundaki rassal hata terimlerinin (iu ) sabit varyanslı, diğer bir ifade ile her alt ana kütle
için hata teriminin varyansının eşit olmasıdır. Sabit varyans varsayımı sağlanamazsa, tahmin
edilen parametrelerin sahip olması istenen özelliklerinden hangileri gerçekleşmez?
Parametrelerin varyanslarının tahmininde ne gibi sorun çıkar? Değişen varyansın tespiti için
kullanılan testler ele alınacaktır. Bu testler sistematik ve sistematik olmayan testlerdir.
Sistematik olmayan testler kalıntı grafiklerinin incelen mesidir ki; bu yolla başarı biraz da
araştırmacının tecrübesine bağlıdır. Sistematik testler parametrik ve parametrik olmayan testler
olarak da ele alınabilir. Parametrik testler yardımcı bir regresyonun tahminini gerektirirken,
parametrik olmayan testler bir test istatistiğine dayanır, yardımcı regresyon tahmin edilmez.
320
12.1. Değişen Varyansın Yapısı
Hane halkı tüketim harcaması ile haftalık gelirin yer aldığı ana kütle için, hane halkının
haftalık tüketim için gerçekleştirdiği ortalama harcama ( )E Y , hane halkı gelirinin (X)
doğrusal bir fonksiyon olarak tanımlanmıştı.
0 1( )E Y X
Bilinmeyen ana kütle parametreler 0 ve
1 , yukarıda verilen harcama fonksiyonu
hakkında bilgi taşımaktadır. Tepki parametresi olan 1 , hane halkı geliri bir birim arttığında
hane halkının ortalama tüketim harcamasının ne kadar değişeceğini gösterir. Sabit terim 0 ,
gelir düzeyi sıfır iken gıda harcamalarını ölçer.
Xi 80 100 120 140 160 180 200 220 240 260
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
i iP Y X 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7
1/6 1/7 1/6 1/6 1/7 1/6 1/7
1/7 1/7 1/7
E Y 65 77 89 101 113 125 137 149 161 173
( )Var Y 325 462 445 707 678 750 685 1043 966 1211
0 ve 1 ’yi tahmin etmek için i=1,2,...,10 şeklinde endekslenen, i. hane halkı için
tüketim harcamasını ve gelir düzeyini gösteren (Yi, Xi) çifti ile n=10 hanelik bir örneklem
düşünelim.
Belirli bir gelir düzeyi ile bütün hane halkları aynı gıda harcamasına sahip olmayacaktır
ve regresyon modelimizin genel tanımlaması doğrultusunda iu ’yi, i. hane halkının tüketim
harcaması (Yi) ile Xi gelir düzeyinde tüm hane halkının ortalama gıda harcaması arasındaki fark
olarak gösterelim.
0 1i i i iu Y E Y Y X
Böylece i. hane halkının tüketim harcamalarını tanımlamak üzere kullanılan model
aşağıdaki şekilde yazılır.
321
0 1i iY X u
0 1( )E Y X , tüketim harcamalarının gelir düzeyiyle açıklanan bölümünü ,
iu yi
ise tüketim harcamalarının diğer faktörler tarafından açıklanan bölümünü göstermektedir.
Buraya kadar özetlediğimiz bilgi önceki derslerimizde sizlere verilmişti. Bu bölümde
0 1( )E Y X ortalama tüketim fonksiyonunun düşük gelirli hanelerin tüketim
harcamalarını yüksek gelirli hanelerin tüketim harcamalarına göre daha iyi açıklayıp
açıklayamadığını sorgulamaya başlıyoruz. Düşük gelirli hanelerin tüketim harcamaları ile
yüksek gelirli hanelerin tüketim harcamalarını tahmin etmek zorunda olsaydınız hangi tahminin
daha kolay olacağını düşünürdünüz? Düşük gelirli hane halkları tüketim için fazla seçeneğine
sahip değildir, ancak gıda, barınma gibi zorunlu tüketim harcamalarında bulunurlar ve bu tür
harcamalar için gelirlerinin büyük bir kısmını kullanırlar. Diğer taraftan, yüksek gelirli hane
halklarının tüketim harcamaları çeşitlilik arz eder. Düşük gelirli hane halkları zorunlu
harcamaları yapıyor iken yüksek gelirli aileler yılda bir iki kez tatile çıkabilir, haftanın belli
günlerinde dışarıda yemek yiyebilir, spor merkezine gidebilir. Böylece gelir değişkeni nispi
olarak yüksek gelirli hane halklarının tüketim harcamalarını açıklamak için daha az önemli bir
değişkendir. Yüksek gelirlilerin tüketim harcamalarını tahmin etmek zordur.
Tam olarak ifade ettiğimiz şeyi tanımlamanın bir başka yolu, iu ’nin büyük pozitif veya
negatif değerler alma olasılığı, yüksek gelirliler için düşük gelirlilere göre daha yüksek
olduğunu söylemektir. Hanenin geliri yüksek ise, gelir dışındaki faktörler tüketim harcamaları
üzerinde büyük bir etkiye sahip olabilir.
İktisadi bir gerçek olan yukarıdaki olgu nasıl modellenecektir? Rassal değişken iu ’nin
varyansı yüksekse, daha yüksek değerler alma olasılığına sahiptir. Bu etki, ( )iVar u yi doğrudan
X’e bağlı bir biçimde tanımlayarak tespit etmek mümkündür. Diğer bir ifade ile, X arttıkça
( )iVar Y arttığını söylemektir. X’in büyük olduğu gözlemlerde tüketim harcaması bağımlı
değişken Y’nin ortalamasından ( 0 1( )E Y X ) daha çok sapabilir. Bu durumda tüm
gözlemlerin varyansları aynı olmadığında değişen varyansın (heteroskedasitenin) varlığından
söz edebiliriz. Alternatif olarak, rassal değişken Y ve rassal hata iu değişen varyanslıdır.
Tersine eğer tüm gözlemler aynı varyansa sahip olasılık yoğunluk fonksiyonundan geliyorsa
sabit varyansın (homoskedasitenin) söz konusu olduğunu söyleyebiliriz ve Y ve iu sabit
varyanslıdır ki bu durum doğrusal regresyon modelinin temel varsayımlarındandır.
322
Şekil 12.1 Değişen varyanslı hatalar
Sabit varyans varsayımının yerine gelmediği durum değişen varyans, Şekil 12.1’de
gösterilmiştir. Değişen varyansı yukarıda verilen tüketim harcamaları ve gelir verilerinin yer
aldığı ana kütleye ait tablonun son satırından da görmeniz mümkündür. Şöyle ki; gelir arttıkça
rassal hatanın varyansı ve dolayısıyla rassal hata ile aynı varyansa sahip olan Y‘nin varyansı da
artmaktadır. Yukarıdaki şekilde iX X iken, ,i if Y X şeklindeki olasılık yoğunluk
fonksiyonu, 1Y ’in yüksek olasılıkla 1E Y ’e yaklaşacağını ifade etmektedir.
2X ’ye doğru
gidildikçe olasılık yoğunluk fonksiyonu 2 2,f Y X daha hızlı yayılacaktır. Örneğin yukarıdaki
ana kütle için 80X iken rassal hatanın varyansı 50 , 100X iken rassal hatanın varyansı 66
dır. Buna göre gelir arttıkça rassal hatanın varyansı da artmakta, dolayısıyla varsayımda durumu
değişen varyans söz konusudur.
Değişen varyansın varlığının yukarıda da ifade ettiğimiz üzere klasik doğrusal
regresyon modelinin temel varsayımlarımızdan birinin ihlalidir. Öncelikle 0 1i iY X u
modeli için iu ’nin sıfır ortalama, sabit varyanslı (σ2) ve rassal hata terimlerinin ilişkisiz
olduğunu varsayımlarını yaptığımızı hatırlayalım. Bu varsayımlar kısaca aşağıdaki gibi
gösterilmiş idi.
0iE u , 2
iVar u , , 0 içini jCov u u i j
Şimdi 2
i iVar Y Var u yi ifade eden sabit varyans varsayımı sorgulanacaktır.
Bunun için sabit varyans varsayımı aşağıdaki gibi başka bir varsayım biçimi ile değiştirilmesi
gerekmektedir.
i i iVar Y Var u h X
Burada ih X , iX arttığında iX ’nin artan bir fonksiyonudur.
Bu bölüm sabit varyans varsayımı gerçekleşmediği durum değişen varyansın
sonuçlarıyla ilgilidir. Değişen varyans durumunda EKK tahmincilerinin özellikleri açısından
323
ne tür sonuçlar ortaya çıkar? Değişen varyansın varlığını nasıl belirleyebiliriz? Daha iyi bir
tahmin tekniği var mıdır?
Değişen varyansın yapısını daha ayrıntılı bir biçimde sunabiliriz ve aynı zamanda
ortalama fonksiyonunun (0 1( )E Y X ) en küçük kareler tahmini ve ilgili en küçük kareler
kalıntılarını yeniden inceleyerek değişen varyansı belirlemek için biçimsel olmayan bir yol
sunabiliriz. Tüketim harcamaları modeli Örnek 1 gözlemleriyle tahmin edilen en küçük kareler
tahmini aşağıdaki gibidir.
ˆ 17.29 0.61i iY X
Bu tahmini fonksiyonun bir grafiği, gözlemlenen tüm harcama-gelir noktalarıyla birlikte
( ,i iY X ) aşağıdaki şekilde gösterilmiştir. Gelir ( X ) arttığında, tahmini ortalama
fonksiyonundan daha fazla sapan veri noktalarının yaygınlığı artar. X arttıkça regresyon
doğrusundan daha uzakta dağılmış noktaların sayısı artar. Bu özelliği tanımlamanın bir başka
yolu, aşağıda tanımlandığı gibi, en küçük kareler kalıntılarında gelir arttığında mutlak değer
olarak artış eğilimi söz konusu olduğunu söylemektir. ˆˆ 17.29 0.61i i iu Y X
Şekil 12.2 Tüketim harcamaları fonksiyonunun EKK tahmini ve gözlemlenen veri noktaları
(Şekil 12.2 için çeviri: yatay eksen: haftalık gelir, 100$, dikey eksen: haftalık gıda
harcaması, $)
Gözlemlenebilen EKK kalıntıları ( ˆiu ), 0 1i i iu Y X ile verilen
gözlemlenemeyen hataların (iu ) tahmini olduğu için yukarıdaki şekil gelir arttığında
gözlemlenemeyen hataların da mutlak değer olarak artış eğilimi sergilediğini gösterir. Diğer bir
ifade ile gelir ( X ) arttığında tüketim harcamasının (Y ) ortalama tüketim harcaması ( E Y )
etrafındaki değişimi artar. Bu tespit, daha önce belirttiğimiz ortalama tüketim harcamaları
fonksiyonunun düşük gelirli hane halkları için tüketim harcamalarını açıklamada yüksek gelirli
hane halklarından daha iyi olduğunu ifade eden hipotez ile devam eder. Değişen varyans ile Y
’nin, ortalaması etrafındaki artan değişimini tespit edebiliriz.
324
Değişen varyans ile daha çok yatay kesit veri kullanıldığında karşılaşılır. Bilindiği üzere
yatay kesit veri terimi, zamanın belirli bir noktasında firma ya da hane halkları gibi ekonomik
birimlere ait veri setini ifade eder. Gelir ve tüketim harcaması için hane halkı verisi de bir yatay
kesit veri setidir. Yatay kesit veri her zaman değişen büyüklükteki ekonomik birimlerin
gözlemlerini içerir. Örneğin hane halkı verisi farklı sayıda hane halkı üyelerini ve farklı hane
halkı gelir düzeylerini içerecektir. Hane halkının daha yüksek gelir düzeyi ne kadar fazla ise
açıklayıcı değişkenler setindeki değişim ile bazı sonuç değişkenlerindeki ( Y ) değişimi
açıklamak o kadar zordur. Y değerlerinin tespit edilmesi konusunda daha yüksek gelirli hane
halklarının daha farklı ve esnek olması muhtemeldir, kısaca homojen değildir. Doğrusal
regresyon modelleri için bunun anlamı şudur: Ekonomik birimin boyutunun daha büyük olması
sonuç Y ile ilişkili daha çok belirsizliğe neden olur. Bu büyük belirsizlik, ekonomik birimin
boyutu ne kadar büyükse o kadar büyük olan bir hata varyansı belirlenerek modellenebilir.
Değişen varyans yatay kesit veri ile sınırlandırılması gereken bir özellik değildir. Bir
firma, bir hane halkı gibi ekonomik birimlerin veya tüm ekonomiye ilişkin zaman serisi verisi
ile hata varyansının değişmesi mümkündür. Eğer bir dışsal şok veya Y hakkında daha fazla ya
da daha az belirsizlik yaratacak durumlarda değişimler söz konusu ise bu doğru olacaktır.
En küçük kareler hatalarının grafikleri değişen varyansı belirlemede biçimsel olmayan
bir yoldur. İleride daha biçimsel testler dikkate alınacaktır.
12.2. En Küçük Kareler Tahmincileri İçin Değişen Varyansın
Sonuçları
Değişen varyansın varlığı 2
iVar u şeklindeki en küçük kareler varsayımının ihlal edildiği
anlamına geldiği için bu ihlal en küçük kareler tahmincimiz için ne gibi sonuçlar yaratır ve onun
için ne yapabiliriz sorusunu sormamız gerekir. Bunun iki anlamı vardır:
1. EKK tahmincisi doğrusal ve sapmasız bir tahminci olma özelliklerini korurlar, ancak
en iyi (tesirli) yani en küçük varyanslı değildir. Daha küçük varyansla başka bir tahmincinin
varlığı söz konusudur.
2. EKK tahmincileri için hesaplanan standart hatalar genellikle doğru değildir. Bu
standart hataları kullanan güven aralıkları ve hipotez testleri yanıltıcı olabilir.
Öncelikle ikinci sonucu ele alalım. Standart hatalara ne oldu?
Değişen varyans söz konusu olmaksızın basit bir doğrusal regresyon modeli aşağıdaki
gibidir.
0 1i i iY X u ve 2
iVar u
1 ’in EKK tahmincisi 1 ’in varyansını daha önce aşağıdaki gibi tanımladığımızı
hatırlayın.
325
2 2
1 2 2ˆ( )
ii
VarxX X
Yukarıdaki tanım rassal hatanın varyansının sabit ve2 ’ya eşit olduğu varsayımına
dayanmakta olup, rassal hatanın varyansının tahmincisi ise 2 2ˆ ˆiu n k ‘dır. Şimdi her bir
gözlemin hata varyanslarının farklı olduğunu varsayalım ve bu farkı σ2’ye i simgesi ekleyerek
gösterelim, böylece;
0 1i i iY X u 2
i iVar u
Yukarıdaki değişen varyans tanımı altında en küçük kareler tahmincisi 1 ’nin varyansı
aşağıdaki gibidir.
2 2 2 2
2 2 1 11 2 2
21 2
1 1
ˆ( )
n n
i i i in
i ii i
n ni
i i
i i
X X x
Var k
X X x
Burada 2 2
i i i i ik X X X X x x ’dir. Sonuç olarak eğer 2
iVar u
geçerli değil ise yukarıdaki varyans denkleminde sadeleştirmeler yapılamayacak ve sonuç
itibariyle artık
2 2
1 2 2ˆ( )
ii
VarxX X
denklemi geçerli olmayacağı için, varyansın kare kökü standart hatalar da geçerli değildir.
Minimum varyanslı doğrusal sapmasız tahmin edici olma anlamında artık en iyi
olmayan en küçük kareler tahmincisini kullanmanın ilk tanımını dikkate almak için minimum
varyans özelliğine sahip alternatif bir tahminciyi nasıl elde edeceğimizi ortaya koymaya
ihtiyacımız vardır.
12.3. Değişen Varyansın Tespit Edilmesi
Ana kütle tüketim harcamaları denkleminde iktisadi gerçekler ile de örtüşen değişen varyansa
neden olacak veri seti kullandık ve gözlemler itibariyle rassal hata varyansının değiştiğini
gördük. Ancak gerçek hayatta ana kütleyi gözlemleyemediğimiz ve örnek verilerinden ana
kütle hakkında çıkarsamalar yaptığımız için ana kütle rassal hata varyansının sabit olup
olmadığına dair belirsizlik vardır. Şunu sormak doğaldır: Eğer değişen varyans, modelim ve
veri setim için olası bir problem ise bunu nasıl anlarım? Değişen varyansı diğer tahmin
yöntemleri ile tespit etmenin bir yolu var mı? Bu soruları araştırmanın iki yolu vardır. İlki
326
kalıntı grafiklerini ele alan biçimsel olmayan yaklaşımdır. Diğeri ise biçimsel olan istatistiksel
testlerdir.
12.3.1. Sistematik olmayan test: Kalıntı Grafikleri
Değişen varyansın varlığını araştırmanın bir yolu, modeli en küçük kareler yaklaşımıyla tahmin
etmek ve en küçük kareler kalıntılarının grafiğini çizmektir. Kalıntı grafiklerinin örnekleri
Bölüm 4’de sunulan Şekil 4.7 ve 4.8’de verilmiştir. Eğer hatalar sabit varyanslı ise kalıntılarda
herhangi bir türden bir örüntü olmaz. Eğer hatalar değişen varyans içeriyorsa onlar sistematik
olarak daha büyük değişimler sergilemeye eğilimli olabilir.
Örneğin hane halkı tüketim harcamaları veri seti için gelir arttığında varyansın da
artacağından şüphelendik. En küçük karelerin kalıntılarının gelir düzeylerine karşı yukarıdaki
grafiğini çizdik. Grafikten gelir arttığında kalıntıların mutlak büyüklüğünün önemli düzeyde
arttığı açık olarak görülmektedir.
Değişen varyansı araştıran bu yönteme herhangi bir basit regresyon denklemi için
başvurulabilir. Çok değişkenli regresyonda kalıntıların sistematik olarak değişip değişmediğini
gözlemlemek için kalıntıların her bir açıklayıcı değişkene ya da ˆiY ’ye karşı grafiği çizilerek
değişen varyansı görsel olarak tespit etmek mümkündür.
12.3.2. Sistematik Testler
12.3.2.1. Lagrange Çarpanı Testleri
Bu bölümde varyans fonksiyonuna dayalı değişen varyans için bir test ele alınacaktır. Varyans
fonksiyonu kavramına başlamak amacıyla öncelikle aşağıda verilen genel çoklu regresyon
modeli için ortalama fonksiyonunu iE Y dikkate alalım.
0 1 1 2 2i i i k ik iY X X X u
327
Şekil 12.3 En küçük kareler gıda harcamaları kalıntılarının gelir düzeyine karşı grafiği.
Varyans fonksiyonu değişen varyansın varlığında geçerli bir yaklaşımdır. Varyansı
1 2 3, , , ,i i i ikX X X X ’dan farklı olarak 1 2 3, , , ,i i i ikZ Z Z Z açıklayıcı değişkenler seti ile
ilişkilendirmemizin dışında yukarıdaki çoklu regresyon modeli için ortalama fonksiyonunu
benzerdir. Varyans fonksiyonunun genel bir biçimi aşağıdaki gibidir.
2 2
0 1 1 2 2( ) ,i i i i i k ikVar Y E u h Z Z Z
h(.) fonksiyonuna ilişkin özel bir tanımlama yapmadığımız için bu genel bir biçimdir. Varyans
fonksiyonuna göre iY ’nin varyansı Z’lere bağlı olarak her bir gözlem için değişecektir.
Örneğin tüketim harcamaları örneği için ortalama ve varyans fonksiyonları sırasıyla aşağıdaki
gibi verilmişti.
0 1( )E Y X
i i iVar Y Var u h X
Denklemlerde sadece bir tane X olduğu için bir tane Z olacaktır. Her ikisi de aynı
değişken hane halkı geliridir.
Lagrange çarpanı testinin üssel fonksiyon, doğrusal fonksiyon gibi çok sayıda .h
fonksiyon için geçerli olması, değişen varyansın tespiti için tercih nedenidir. Biz dersimizde
sadece doğrusal fonksiyonu ele alacağız.
Doğrusal varyans fonksiyonu aşağıdaki gibidir.
0 1 1 2 2 0 1 1 2 2, ,i i k ik i i k ikh Z Z Z Z Z Z
1 2 k olduğunda .h fonksiyonunun aşağıdaki şekilde daralır.
0 1 1 2 2 0,i i k ikh Z Z Z h
0h terimi bir sabittir ve 0 0h ‘dır. Buna göre varyans herhangi bir açıklayıcı
değişkene bağlı değildir. Diğer ifadeyle 1 2 0k ise değişen varyans söz konusu
değildir; varyans sabittir ve söz konusu durumu 2
0h şeklinde yazabiliriz.
Varyans fonksiyonu tanıtıldıktan sonra şimdi değişen varyansın testi için Lagrange
Çarpanı testinin uygulama aşamalarını verebiliriz.
Lagrange Çarpanı testi için temel ve alternatif hipotezler aşağıdaki gibidir.
0 1 2: 0sH
328
1 :Tüm 'ler sıfırdan farlıdır.sH
Temel ve alternatif hipotezler bir testin ilk bileşenleridir. Hipotezlerde yer alan ’lar
değişen varyansın kaynağı olduğu düşünülen değişkendir. Sonraki bileşen, bir test istatistiğidir.
Bir test istatistiğini elde edebilmek için doğrusal varyans fonksiyonunu
i i iVar Y Var u h X da yerine koyarak aşağıdaki eşitliğe ulaşılır.
2 2
0 1 1 2 2( ) ,i i i i i s isVar Y E u h Z Z Z
2 2( )i i iv u E u , bir hata karesi ( 2
iu ) ve onun ortalaması ( 2( )iE u ) arasındaki fark ile
tanımlanırsa yukarıdaki denklem, aşağıdaki biçimde yazılabilir.
2 2
0 1 1 2 2( ) ,i i i i i s is iu E u v Z Z Z v
Varyans fonksiyonuna iv ’nin eklenmesi ortalama fonksiyonuna iu ’nin ilave
edilmesiyle benzer bir amaca hizmet etmektedir. Bilindiği üzere iE Y ortalama fonksiyonuna
iu ’nin ilave edilmesiyle aşağıdaki genel regresyon modeli elde edilir:
1 0 1 1 2 2i i i i k ik iY E Y u X X X u
Ancak önemli bir farklılık vardır. Genel regresyon modelinde bağımlı değişken Y
gözlemlenebilir. Ancak, eğer 2 2
0 1 1 2 2( ) ,i i i i i s is iu E u v Z Z Z v tahmin
etmek istersek gerçek regresyon hataları ( iu ) gözlemlenemediği için bilinmediğinden dolayı
“bağımlı değişken” durumundaki 2
iu ’in de bilinmediği sonucuna rahatlıkla ulaşılabilir. Ancak
2
iu ’yi 0 1 1 2 2i i i k ik iY X X X u ’’dan elde edilen en küçük kareler kalıntılarının
kareleri ( 2ˆiu ) ile yer değiştirerek bu problem çözülür. Böylece
2
0 1 1 2 2 ,i i i s is iu Z Z Z v
Yerine yardımcı regresyon olarak adlandırılan işlevsel biçimi aşağıdaki gibi yazılır.
2
0 1 1 2 2ˆ ,i i i s is iu Z Z Z v
Önemli not: 2
iu yerine 2ˆiu ’yi kullanmak yeni rassal hata iv ’nin tanımını değiştirir. Bu
farklılığı göstermek için yukarıdaki denklemde esasen iv yerine *
iv yazılması gerekir. Ancak
gereksiz karışıklıklardan kaçınmak için aynı notasyon kullanılmıştır.
Değişen varyans için varyans fonksiyonu testi için, yardımcı regresyon daki en küçük
kareler tahmininden edinilen değerler kullanılır. 1 2 3, , , ,i i i isZ Z Z Z değişkenlerinin 2ˆiu ’deki
değişimi açıklamaya yardımcı olup olmadığını belirlemeyle ilgileniyoruz. Modelin tahmini ile
elde edilen uyum iyiliği istatistiği 2R , Z’ler tarafından açıklanan 2ˆ
iu ’lerin değişim oranını
329
ölçtüğü için bir test istatistiğinin genel elemanıdır. 0H doğru ise , 2R ile gözlem sayısının
çarpımı 1s serbestlik derecesiyle Ki-kare (χ2) dağılımına sahiptir ve test istatistiği aşağıdaki
gibidir.
2 2 2
1sn R
χ2 dağılımını kullanmak için bir takım kısıtlar söz konusudur. χ2 dağılımı, çok farklı
türdeki hipotezlerin test edilmesi amacıyla kullanılan bir dağılımdır. F rassal değişkeni gibi χ2
rassal değişkeni de sadece pozitif değerler alır. Büyük bir2R değeri sıfır hipotezine karşı
kanıt sağladığı için (varyanstaki değişimlerin z değişkenleri tarafından açıklandığını varsayar)
test istatistiği için ret bölgesi dağılımın sağ kuyruğundadır. Böylece %5 anlamlılık düzeyi için
0H reddedilir ve genellikle
2 2
0.95, 1s
ise sabit varyans varsayımının geçerli olmadığı
değişen varyansın söz konusu olduğuna karar verilir. Lagrange çarpanı testi büyük örneklem
testidir.
12.3.2.2. White Testi
Lagrange çarpanı testiyle ilgili problem, eğer değişen varyansın alternatif hipotezi doğru ise
varyans fonksiyonunda bulunan değişkenler hakkında bilgi sahibi olunduğunu diğer bir ifade
ile bu değişkenlerin ( 1 2 3, , , ,i i i isZ Z Z Z ) değişen varyansın kaynağı olduğunun öngörülmesidir.
Gerçekte ise değişen varyans ilgili değişkenlere ilişkin herhangi bir bilgi olmaksızın test
edilmek istenir. Genellikle, varyansı etkileyen değişkenler ortalama fonksiyonundakilerle
aynıdır. Ortalama fonksiyonunun iki açıklayıcı değişkene sahip olduğunu varsayalım.
1 0 1 1 2 2i iE Y X X
White testinde Z ’ler X ’lere, X ’lerin karelerine ve X ’lerin olası çapraz çarpım
terimlerine eşit olarak tanımlanır. White testi çarpım terimleri olmaksızın aşağıdaki şekilde
gösterilir:
1 1Z X , 2 2Z X , 2
3 1Z X , 2
4 2Z X , 5 1 2Z X X
White testi, F testi ya da 2 2n R testi kullanılarak uygulanır. İki tane bağımsız
değişkeni olan bir model için White testinin aşamaları aşağıdaki gibidir.
Regresyon denklemi tahmin edildikten 0 1 1 2 2ˆ ˆ ˆˆ
i i iY X X sonra kalıntılar ( iu )
hesaplanır.
Yardımcı regresyon denklemi kurulur. Yardımcı regresyonun bağımlı değişkeni (
Lagrange çarpanı testinde olduğu gibi) ilk aşamada hesaplanan kalıntıların kareleri, bağımsız
değişkenleri ise yukarıda tanımlanan Z ’dir. Buna göre yardımcı regresyon aşağıdaki gibi
tanımlanır.
330
2
0 1 1 2 2 3 3 4 4 5 5ˆ
i i i i i i iu Z Z Z Z Z v
Yardımcı regresyonun belirginlik katsayısı (R2) hesaplanır ve temel ve alternatif
hipotezler kurulur.
0 1 2 3 4 5: 0H
1 1 2 3 4 5: 0H
Temel ve alternatif hipotezde yer alan parametrelerin Z’lerin katsayısı olduğuna sabit
parametrenin hipotezler dâhil edilmediğine dikkat edin.
0H doğru ise , 2R ile gözlem sayısının çarpımı yardımcı regresyondaki bağımsız
değişken sayısı k (burada k=4) serbestlik derecesiyle Ki-kare (χ2) dağılımına sahiptir ve test
istatistiği aşağıdaki gibidir.
2 2 2
kn R
değeri hesaplanır. Gözlem sayısı hem ana modelde hem de yardımcı regresyon modelinde
aynıdır.
2 ve 2
k ile mukayese edilir. 2 2
k ise sabit varyans varsayımını ifade eden 0H
temel hipotezi reddedilir. Modelin hata teriminin varyansı gözlemler itibariyle değişmektedir.
Açıklayıcı Örnek: Tüketim Harcamaları Modeli
White testinin uygulaması için tüketim harcamaları örnek 1’in verileri kullanılacaktır.
Hatırlanacağı üzere Örnek 2 verilerinden örnek regresyon fonksiyonu ˆ 9.37 0.65i iY X
olarak elde edilmişdi. Varyansın potansiyel olarak gelirin bir fonksiyonu olduğu tüketim
harcamasının bu örneğinde değişen varyansı test etmek için 2
0 1i ih X şeklindeki
varyans fonksiyonunda 0 1: 0H hipotezini alternatifi olan 1 1: 0H hipotezine karşı test
ederiz.
ˆ 9.37 0.65i iY X modeli için belirginlik katsayısı 2 0.90R , n=10 olduğuna göre
test istatistiği
2 2 10 0.90 9n R
Sıfır hipotezinde sadece bir parametre olduğu için χ2 testinin serbestlik derecesi birdir.
%5 kritik değeri 3.84’tür. 9,;3.84’ten daha büyük olduğu için H0 hipotezini reddederiz ve
varyansın gelire bağlı değiştiğini kabul ederiz.
White testinin uygulamasına yardımcı regresyon 2 2
0 1 2ˆ
i i iu X X fonksiyonunu
EKK yaklaşımı ile tahmin ederek başlarız ve 0 1 2: 0H hipotezini
331
1 1 2: 0 veya 0H hipotezine karşı test ederiz. Yardımcı regresyon aşağıdaki gibi tahmin
edilmiştir.
2 2ˆ 1038.16 15.95 0.057i i iu X X 2 0.85R
Buradan test istatistiği
2 2 10 0.85 8.5n R
olarak hesaplanır. %5 kritik değer 2
0.95,25.99 ’dir. Tekrar, gelire bağlı değişen varyansın
söz konusu olduğu sonucuna ulaştık.
12.3.2.3. Goldfeld-Quandt Testi
Goldfeld-Quandt testi büyük örneklere uygulanan F-testidir. Goldfeld-Quandt testi, olası farklı
varyanslı iki grup veri için tasarlanmıştır. Bu durumu tanıtmak için, ücretliler için tüketim
fonksiyonu ile serbest meslek sahiplerinin tüketim modelinin farklılaştığı iktisadi gerçeklere
uygundur. Serbest meslek sahipleri genel olarak ücretlilere göre daha fazla gelir elde ettikleri
için tüketimleri ücretlilere göre farklılık arz eder. Ücretliler ve serbest meslek sahiplerini tek
bir grup olarak düşünür ve ortalama tüketim denklemini elde etmek istersek, tüketim
kalıplarının farklılığından dolayı değişen varyans problemi ile karşılaşmamız kaçınılmazdır.
Sorduğumuz soru: ücretlilerin tüketim varyansı ile karşılaştırıldığında serbest meslek
sahiplerinin tüketim varyansı ne kadardır? Varyanslar aynı ya da farklı mıdır? Ücretlilerin
tüketim ve serbest meslek sahiplerinin tüketim varyansı yukarıdaki nedenden dolayı tüm
gözlemler için sabit değildir. Goldfeld-Quandt testi değişen varyansın örneklemin iki gruba
bölünebildiği –bu durumda ücretliler ve serbest meslek- biçimini test etmek amacıyla
tasarlanmıştır ve varyansın iki grup için farklı olabileceğinden şüpheleniriz.
Test, her bir gruptan tahmin edilen hata varyanslarının karşılaştırılmasına
dayanmaktadır. Goldfeld-Quandt testi, rassal hataların normal dağıldığı ve birbirleri ile ilişkisiz
oldukları (otokorelasyon olmadığı) varsayımına dayanmaktadır.
Testin uygulamasının ilk aşamasında X bağımsız değişkeni küçükten büyüğe ilgili Y
bağımlı değişkeni ile sıralanır. Sıralanan gözlemlerin ortasından c sayıda gözlem çıkarılır.
Geriye kalan n-c sayıdaki gözlem ikiye ayrılır 2n c . Bu durumda ilk grupta küçük değerli
X’ler, ikinci grupta ise daha büyük değerli X’ler yer alacaktır. Amaç bu iki grubun
varyanslarının eşit olup olamadığını tespit etmektir. Eğer eşit değilse X’lerin değeri artarken
rassal hatanın da varyansının arttığı sonucunu çıkarırız. Burada önemli iki önemli husus vardır.
Bunlardan ilki dışlanan gözlem sayısı c’nin kaç olacağıdır. Monte Carlo denemelerine göre
n=30 iken c=4, n=60 iken c=10 alınmasının yeterli olduğu konusunda bir görüş vardır. İkincisi
ise çok değişkenli regresyon modelinde sıralama işleminin hangi X değişkenine göre
yapılacağıdır. Şayet hangi bağımsız değişkenin değişen varsa sebep olabileceği öngörüle
biliniyorsa sıralama o değişkene göre yapılır, aksi takdirde her değişken için test tekrarlanır.
332
İki alt gruptan küçük X değerlerinin bulunduğu gözlemler için rassal hatanın varyansı2 2( )K iKVar u ile, büyük X değerlerinin bulunduğu gözlemler için rassal hatanın varyansı
2 2( )B iBVar u ile gösterilsin.
2 2( )K iKVar u ve
2 2( )B iBVar u eşitliklerinin söz konusu olduğu şeklindeki 2 2
K B
sıfır hipotezini test etmek istiyoruz. Test istatistiği aşağıdaki gibidir.
2 2
,2 2
ˆ
ˆ B k
B B
n k n k
K K
F F
Burada ( )Bn k ve ( )Kn k , iki alt örneklemli regresyonlar için serbestlik dereceleridir ve
B Kn n eşitliği geçerlidir. Diğer bir deyişle bir varyans tahmininin onun gerçek ana kitle değeri
oranına eşit bir paya ve diğer varyans tahmininin onun ana kitle değeri oranına eşit bir paydaya
sahip olan F istatistiği, ( , )B Kn k n k şeklindeki serbestlik derecesi ile bir F dağılımına
sahiptir.
Aşağıdaki hipotezleri test etmek istediğimizi varsayalım:
2 2
0 : B KH
2 2
1 : B KH
H0 doğru ise yukarıdaki test istatistiği aşağıdaki gibi olur.
2
2
ˆ
ˆB
K
F
Denklemde yer alan rassal hataların varyanslarının 2 2ˆ ˆîu n k ile tahmin edildiğini
hatırlayın. Hesaplanan test istatistiği verilen bir anlamlılık düzeyinde ( , )B Kn k n k
şeklindeki serbestlik dereceli cF değerinden büyükse değişen varyans olduğu sonucuna varılır.
Açıklayıcı Örnek: Tüketim Harcamaları Modeli
İkinci bölümde verilen ana kütleden rastlantısal 30 aile çekilmiş ve aşağıdaki örnek
regresyon fonksiyonu elde edilmiştir.
2 ˆ9.29 0.64 30 0.95 9.18
ˆ( ) (5.231)(0.638)
i
i
Y X n R
Se
333
Yukarıdaki tüketim modelinde değişen varyansın varlığını Goldfeld-Quandt testi araştıralım.
Gözlem ler Y (Tüketim) X
(Gelir)
Sıralı Y Sıralı X
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
55
65
70
80
79
84
98
95
90
75
74
110
113
125
108
115
140
120
145
130
152
144
175
80
100
85
110
120
115
130
140
125
90
105
160
150
165
145
180
225
200
240
185
220
210
245
55
70
75
65
74
80
84
79
90
98
95
108
113
110
125
115
130
135
120
140
144
152
140
80
85
90
100
105
110
115
120
125
130
140
145
150
160
165
180
185
190
200
205
210
220
225
334
24
25
26
27
28
29
30
180
135
140
178
191
137
189
260
190
205
265
270
230
250
137
145
175
189
180
178
191
230
240
245
250
260
265
270
Yukarıdaki tablonun 4. ve 5. Sütunları Goldfeld-Quandt testinin birinci aşamasıdır. X
değerleri küçükten büyüğe doğru ilgili Y değerleri ile birlikte sıralanmıştır. n=30 olduğuna göre
ortadan c=4 gözlem analiz dışı bırakılacaktır. Bunlar 14.,15., 16. ve 17. gözlemlere ilişkin
verilerdir. Böylece verimiz aşağıdaki gibi iki alt örnekleme ayrılmıştır.
1.Alt Örneklem
(Küçük X’ler için)
2.Alt Örneklem
(Büyük X’ler için)
Gözlemler Sıralı Y Sıralı X Gözlemler Sıralı Y Sıralı X
1
2
3
4
5
6
7
8
9
10
11
55
70
75
65
74
80
84
79
90
98
95
80
85
90
100
105
110
115
120
125
130
140
18
19
20
21
22
23
24
25
26
27
28
135
120
140
144
152
140
137
145
175
189
180
190
200
205
210
220
225
230
240
245
250
260
335
12
13
108
113
145
150
29
30
178
191
265
270
Yukarıdaki iki alt örneklem için örnek regresyon fonksiyonu tahmin edilir. Not: Basit
regresyon modelinin tahmin edilmesini ve model ile ilgili aşağıdaki unsurların nasıl
hesaplandığını biliyor olmanız gerekmektedir. Tahmin sonuçları aşağıda raporlanmıştır.
1.Alt Örnek
2 2
1 1 1 1ˆ ˆ3.409 0.67 13 0.89 5.86 377.17
ˆ( ) (0.074)(8.70)
i i i
i
Y X n R u
Se
2. Alt Örnek
2 2
2 2 2 2ˆ ˆ28.03 0.79 13 0.77 11.82 1536.8
ˆ( ) (30.62)(0.132)
i i
i
Y X n R u
Se
Goldfeld-Quandt testi için temel va alternatif hipotezler aşağıda verilmiştir.
2 2
0 1 2:H
2 2
1 1 2:H
1.Alt Örnek için rassal hataların varyansının tahmini aşağıdaki gibidir. (Gözlem sayısı
n1 =13, Tahmin edilen paramatre sayısı k=2
2
12
1
1
ˆ 377.17 377.17ˆ
1334.2
2 119
iu
n k
2.Alt Örnek için rassal hataların varyansının tahmini aşağıdaki gibidir. (Gözlem sayısı
n2=13, Tahmin edilen paramatre sayısı k=2
2
22
2
2
ˆ 1536.8 1536.8ˆ 139.71
13 2 11
iu
n k
değerlerini elde ederek aşağıdaki F istatistiğini hesaplarız.
2
2
2
1
ˆ 139.714.07
ˆ 34.29F
336
Varyansların artabileceğini ancak gelirle azalmayacağını düşünerek %5 anlamlılık
düzeyinde kritik değeri 0.95,11,11
2.82F olan bir tek kuyruk testi kullanırız. 4.07>2.82 olduğu
için sabit varyansı ifade eden sıfır hipotezi varyansların gelirle birlikte artacağını ifade eden
alternatif hipotez lehine reddedilir.
12.3.2.4. Spearman Sıra Korelasyon Testi
Yukarıda tanıtılan 3 test de test istatistiklerinin hesaplanması yardımcı regresyonların tahmin
edilmesi ile mümkün olduğu için parametrik testlerdir. Değişen varyansın tespitine yönelik
tanıtılacak test, parametrik olmayan bir testdir ve bu yönüyle ilk üç testden ayrılmaktadır.
Öncelikle istatistikte kullanılan Sıra korelasyon testinin ne olduğuna kısaca değinelim. X ve Y
değerleri arasındaki korelasyonu hesaplamak yerine, 2 serideki kıymetler büyükten küçüğe ya
da küçükten büyüğe numaralandırılarak, bu sıra numaraları arasındaki ilişki araştırılırsa buna
sıra korelasyon testi adı verilmektedir. Ekonometride değişen varyansın tespiti için bu testin
uygulamasında kalıntı ile X bağımsız değişkenine sıra numarası verilir.
Spearman sıra korelasyon testinin uygulaması aşağıdaki gibidir.
Öncelikle değişen varyansın varlığının araştırıldığı tahmin edilmiş regresyon
denkleminden kalıntılar elde edilir. Kalıntıların işareti dikkate alınmadan (mutlak değerleri ile)
büyükten küçüğe ya da küçükten büyüğe sıralanır. Aynı işlem X bağımsız değişkeni için de
yapılır. Her iki sıra numarası arasındaki fark (d) hesaplanır. Daha sonra kalıntıların sıra
kıymetlerı ile X değişkenin sıra kıymetleri arasındaki ilişkiyi gösteren aşağıdaki Spearman sıra
korelasyon katsayısı hesaplanır.
2
21 6
1
i
s
dr
n n
Buradaki i i id X u= - şeklinde hesaplanır ve sıralama kıymetleri arasındaki farkı ifade eder.
n gözlem sayısıdır. Anakütle korelasyon katsayısının 0’a eşit ve gözlem sayısının 8’den
büyük olduğu varsayımına göre, spearman sıra korelasyon testi n-2 serbestlik derecesi ile t –
dağılımına uygunluk göstermektedir ve test istatistiği aşağıdaki gibidir.
22
2
1
s
n
s
r nt t
r
Test istatistiğinin hesaplanan değeri verilen anlamlılık düzeyinde 2n
t
değerinden
büyükse değişen varyansın varlığı kabul edilir.
Açıklayıcı Örnek: Tüketim Modeli
1982-1995 yılları arasındaki Gelir (Y) ve Tüketim (C) verilerinden tahmin edilen
regresyon fonksiyonu aşağıda raporlanmıştır. Değişen varyansın varlığını Spearman Sıra
korelasyon testi ile araştıralım.
337
2 ˆ1796.09 0.69 14 0.92 328.78
ˆ( ) (596.84)(0.056)
i i
i
C Y n R
Se
Modelin verileri ve kalıntılar aşağıdaki gibidir.
Yıllar Tüketim (C ) Gelir (Y) ˆiu
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
6702
6812
7399
8095
8935
9447
9369
9097
8788
8843
9189
9585
9957
10409
7357
7752
8325
8987
9699
10076
10365
10323
10213
10637
11126
11485
12051
12693
-177.21
-340.13
-149.02
89.56
437.64
689.16
411.48
168.5
-64.49
-302.44
-294.3
-146.34
-165.41
-156.98
Spearman sıra korelasyon testi uygulamasının ilk aşaması kalıntılar ve bağımsız
değişkenlere küçükten büyüğe veya büyükten küçüğe sıra numarası vermektir. Biz
uygulamamızda küçükten büyüğe sıra numarası vereceğiz. Okuyucu isterse büyükten küçüğe
sıra numarası vererek aynı sonuca ulaşabilir.
Gelir (Y) sıra no ˆiu sıra no id 2
id
338
1
2
3
4
5
6
9
8
7
10
11
12
13
14
8
11
4
2
13
14
12
7
1
10
9
3
6
5
-7
-9
-1
2
-8
-8
-3
1
6
0
2
9
7
9
49
81
1
4
64
64
9
1
36
0
4
81
49
81
0id 2 524id
Not: 0id olmalıdır.
Spearman sıra korelasyon katsayısı
2
2 2
5241 6 1 6 0.1516
1 14 14 1
i
s
dr
n n
olarak hesaplanır. Spearman sıra korelasyon katsayısı test istatistiğinin değeri:
2 2
0.1516 14 220.5312
1 1 0.1516
s
s
r nt
r
339
0.5312t değeri 0.05,14 2 0.05,12
2.179ct t t
ile karşılaştırıldığında
0.5312 2.179ct t olduğu için tüketim modeli için sabit varyans varsayımının geçerli
olduğu sonucuna varılır.
12.4. Değişen Varyansın Varlığı Durumunda Parametre Tahmin
Yöntemleri
Hata terimleri değişen varyanslı olduğunda en küçük kareler tahmincisi en iyi doğrusal
sapmasız tahminci değildir. Değişen varyansın varlığı durumunda model
Genelleştirilmiş En Küçük Kareler
Ağırlıklı En Küçük Kareler
yöntemleri ile tahmin edilir. Burada tahmin yöntemlerinin neler olduğu verilmekle
yetinilecektir. Bu konu hakkında daha fazla okuma yapmak isteyenler, Temel Ekonometri
kitaplarından yararlanabilir.
340
Uygulamalar
341
Uygulama Soruları
1-4 arası sorular aşağıda raporlanmış sonuçlara göre cevaplandırılacaktır.
2
1 2ˆ 0.61 19.23 0.36 0.69 21
ˆ( )(0.05) (3.52) (0.035)i
Y X X R n
Se
Modelinde değişen varyansın varlığını araştırmak için aşağıdaki yardımcı regresyon
modeli tahmin edilmiştir. ( tahmin edilen modelin parametrelerini, yardımcı
regresyonun parametrelerini ifade etmek üzere)
2 2
2ˆ 1.45 3.78 0.84
ˆ( )(0.35) (1.075)
i
i
u X R
Se
1) Değişen varyansın testi için temel ve alternatif aşağıdakilerden hangisidir?
a) 0 0 1: 0H ,
1 0 1: 0H
b) 0 1 2: 0H ,
1 1 2: 0H
c) 0 2: 0H ,
1 2: 0H
d) 0 1: 0H ,
1 1: 0H
e) 0 0 1 2: 0H ,
1 0 1 2: 0H
2) Test istatistiğinin değeri nedir? ( 0.05 )
a) 14.49
b) 17.64
c) 1.68
d) 1.38
e) 32.84
3) Test istatistiği hangi dağılıma uyar, test istatistiğinin değeri nedir?
a) Ki-kare2
2 5.991
b) Ki-kare, 2
1 3.841
c) Ki-kare2
3 7.815
d) t-, 21 2
2.093t
e) t-, 21
1.721t
4) Karar için aşağıdakilerden hangisi doğrudur?
a) 17.64 > 3.841 değişen varyansın varlığı kabul edilir.
b) 14.49 >7.815 değişen varyansın varlığı kabul edilir.
c) 1.68 <5.991 sabit varyans kabul edilir.
d) 1.38<2.093 sabit varyans kabul edilir.
e) 32.84>1.721 değişen varyans kabul edilir.
5) Spearman sıra korelasyon testi ile
Gözlem 1 2 3 4 5 6 7
342
ˆtu -0.92 1.83 -3.61 2.06 0.11 -0.43 1.91
X 2 6 4 5 11 9 1
Y 4.6 0.8 11 7.64 5.12 3.92 6.54
değişen varyansın araştırılması için aşağıdaki sıralamalardan hangisi doğrudur?
a)
ˆtu 6 3 7 1 4 5 2
X 6 3 5 4 1 2 7
b)
ˆtu 5 4 1 2 7 6 3
X 6 3 5 4 1 2 7
c)
ˆtu 6 3 7 1 4 5 2
Y 5 7 1 2 4 6 3
d)
ˆtu 5 4 1 2 7 6 3
Y 5 7 1 2 4 6 3
e)
ˆtu 6 3 7 1 4 5 2
X 6 3 5 4 1 2 7
6) 40 gözleme ait verilerden aşağıdaki regresyon modeli tahmin edilmiştir.
2
1 2 3ˆ 12.94 0.47 3.96 0.03 0.69 40
ˆ( )(3.41) (0.12) (0.035) (0.015)i
Y X X X R n
Se
3X değişkeninin değişen varyansa sebep olduğunun testi amacıyla aşağıdaki modeller tahmin
edilmiştir.
2 2
1 2 3
2 2
1 2 3
ˆ ˆ1.04 120.7 13.6 4.13 24.7 0.69 15
ˆ ˆ21.94 2.71 0.87 2.07 3.81 0.53 15
B
K
Y X X X R n
Y X X X R n
Aşağıdakilerden hangisi yanlıştır.
a) Ortadan atılan gözlem sayısı 8’dir.
b) Test istatistiğinin değeri 6.48 olarak hesaplanmıştır.
c) 0.05 anlamlılık seviyesinde F tablo değeri 2.69’a eşittir.
d) Değişkenler 3X Bağımsız değişkeninin değerine göre küçükten büyüğe doğru
sıralanmışlardır.
e) Modelde sabit varyans vardır.
7) Aşağıdaki ara sonuçlara göre spearman sıra korelasyon katsayısının değeri
nedir?
2 2 2ˆ178 12 0.04 0.91id n R
a) 0.38
343
b) 1.20
c) -0.38
d) 0.61
e) -0.02
8) Aşağıda tahmin edilen regresyon modelinde 2
1ˆ 1.24 0.93 1.94 0.98 29 1.96
ˆ( ) (0.02) (0.13) (0.84)
t t t
i
Y X Y R n DW
Se
Değişen varyansın tespiti amacıyla aşağıdaki regresyon modeli tahmin edilmiştir.
2 2 2
1 1 1ˆ 4.91 2.31 0.271 1.12 0.07 0.27 0.13t t t t t t tu X X Y Y X Y R
Aşağıdaki ifadelerden hangisi yanlıştır?
a) 0 1 2 3 4 5: 0H
0 1 2 3 4 5: 0H
b) Test istatistiğinin değeri 3.77’dir.
c) Tablo değeri 2
0.95,511.070 ’dir
d) Temel hipotez kabul edilir, değişen varyans sorunu yoktur.
e)
2 2
0.95,53.77 11.070
9) Aşağıdakilerden hangisi değişen varyansın tespiti için kullanılan parametrik
olmayan bir testtir.
a) White testi
b) Lagrange çarpanı testi
c) Spearman sıra korelasyon testi
d) Goldfeld-Quandt testi
10) Değişen varyansın tespiti için X’in küçük değerlerinin yer aldığı 15 gözlemlik
regresyon modeline ilişkin ara sonuçlar aşağıdaki gibidir. 2 27153,667 10123.33 5498.933xy x y
X’in büyük değerlerinin yer aldığı 15 gözlemlik regresyon modeline ilişkin ara
sonuçlar aşağıdaki gibidir.
2 29280 12250 8665.6xy x y
Değişen varyansın varlığını test edin.
Bu uygulamada X ilgili bağımsız değişkeni ile küçükten büyüğe sıralanmış ve Küçük X
değeri için bir regresyon, büyük X değerleri için ikinci bir regresyon tahmin edildiği verilerden
anlaşılmaktadır. Buna göre uygulanan test Goldfeld-Quandt testi olup, bu test iki alt
regresyonun hata terimilerinin eşitliğinin testine dayanmaktadır. Öyleyse temel ve alternatif
hipotezler aşağıdaki gibidir.
344
2 2
0
2 2
1
:
:
B K
B K
H
H
Test istatistiği ise;
2
,2 b k
B
n k n k
K
F F
Ancak dikkat edilirse alt regresyonlara ait hata terimlerinin varyanslarının tahminler
verilmemiş, sizin hesaplamanız istenmiştir. Şimdi önceki derslerimizde öğrendiğimiz bilgiler
ile hata terimlerinin varyanslarını tahmin edelim.
2
2ˆ
ˆK
K
k
u
n k
bunun için 2 2 2ˆ ˆy y u eşitliğinden öncelikle 2ˆ
Bu hesaplanması gerekir
.Yukarıdaki verilerde toplam değişme 2 5498.933y olarak verilmiş, regresyon ile
açıklanan değişmenin hesaplanabilmesi için ara sonuçlar verilmiştir 2 2 2
1ˆˆ
iy x ) buna
göre aşağıdaki işlemler sırasıyla uygulanır.
1 2
7153,667ˆ 0.7110123.33
xy
x
2 2 2 2
1ˆˆ (0.71) 10123.33 5055.15iy x buradan
2 2 2ˆ ˆ 5498.933 5055. 443.7815 3Ku y y
Ve küçük X değerlerinin yer aldığı alt regresyonun hata teriminin varyansı aşağıdaki gibi
tahmin edilir.
2
2 443.783ˆˆ
1534.13715
2
K
K
k
u
n k
Aynı şekilde büyük X’lerin değerlerinin yer aldığı alt regresyonun hata teriminin varyansının
tahmini için;
1 2
9280ˆ 0.7612250
xy
x
2 2 2 2
1ˆˆ (0.76) 1225 7075.60iy x
2 2 2ˆ ˆ 8665.6 7075.6 1590Bu y y
2
2 1590122.
ˆ
23
51ˆ
1
B
B
B
u
n k
345
Goldfeld-Quandt testinin istatistiği aşağıdaki gibi hesaplanır.
2
2
122.31
34.137153.58B
K
F
Tablo değeri
0.95;13,132.57F
Karar
0.95;13,133.58 2.57F F alternatif hipotez kabul edilir, X’in değeri arttıkça hata teriminin
de değeri artmaktadır.
Cevaplar
1.d), 2.b), 3.b), 4.a), 5.b), 6.e), 7.a), 8.a), 9.c), 10. çözümlendi
346
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde değişen varyans kavramını ve değişen varyansın varlığı halinde tahmin
edilen parametreler, parametrelerin varyansları, hipotez testleri ve güven aralıkları üzerindeki
etkilerini öğrendik. Değişen varyansın tespitine yönelik parametrik ve parametrik olmayan
testler verilmiştir. Bu testlerden lagrange çarpanı, White testi ve Goldfeld-Quandt testi değişen
varyansın tespiti için yeni regresyon modellerinin tahmin edilmesini gerektirdiğinden
parametrik testlerdir. Spearman sıra korelasyon testi ise parametrik olmayan testlerdir. Ayrıca
değişen varyans durumunda EKK yerine genelleştirilmiş EKK ve ağırlıklı EKK yöntemlerinin
kullanılması gerektiği belirtilmiştir.
347
Bölüm Soruları
1) Aşağıdakilerden hangisi doğrudur?
a) Değişen varyans ana kütle ile ilgili bir sorundur.
b) Değişen varyans sorunu genellikle zaman serilerinin kullanıldığı modellerde
karşılaşılır.
c) Y’in değeri artarkan hata teriminin varyansı da artıyorsa değişen varyans sorunu
vardır.
d) Değişen varyansın sembolik ifadesi: 2 2
i iE u E u
e) Gözlem sayısı az ise değişen varyans problemi ile karşılabiliriz.
2) Değişen varyansın varlığı halinde EKK tahmincisi ……. ve ……. bir tahminci
olma özelliklerini korurlar. ancak en iyi (tesirli) yani en küçük varyanslı değildir.
Daha küçük varyansla başka bir tahmincinin varlığı söz konusudur.
a) En küçük varyanslı - sapmasız
b) Doğrusal- sapmasız
c) Doğrusal – en küçük varyanslı
d) Tutarsız- doğrusal
e) Sapmasız – tutarsız
3) Değişen varyansın varlığı halinde EKK tahmincisi hesaplanan standart hatalar
doğru değildir. Bu nedenle güven aralıkları ve hipotez testleri yanıltıcı olabilir.
a) Belirginlik katsayısı- düzeltilmiş belirginlik katsayısı
b) hata teriminin varyansı- güven aralıkları
c) hata teriminin varyansı – hipotez testleri
d) serbestlik derecesi- güven aralıkları
e) güven aralıkları - hipotez testleri
4) Aşağıda verilen tabloya göre;
X 5 7 9 11 13 15 17
( )iVar u 0.78 0.87 1.01 1.52 1.69 2.03 3.02
Değişen varyans hakkında ne söyleyebilirsiniz?
a) Sabit varyans varsayımı geçerlidir.
b) Koşullu olasılıklar sabit ise değişen varyans vardır.
c) Yukarıdaki veriler değişen varyans için bir sonuca varmada yeterli değildir.
d) X’in değeri arttıkça hata teriminin varyansı azalmaktadır.
e) X’in değeri arttıkça hata teriminin varyansı da artmaktadır.
348
5) Aşağıdakilerden hangisi yanlıştır?
a) Değişen varyansın varlığı halinde EKK tahmincilerinin varyans formülleri geçerli
değildir.
b) Değişen varyansın varlığı halinde EKK tahmincilerinin standart hataları
geçersizdir.
c) Değişen varyansın varlığı halinde EKK tahmincileri en küçük varyanslı değildir.
d) Değişen varyansın varlığı halinde başka tahmin yönteminden de küçük varyanslı
tahminler elde edilemez.
e) Değişen varyansın varlığı halinde EKK tahmincileri etkin değildir.
6) Aşağıda verilen tabloya göre;
X 20 30 40 50 60 70 80
( )iVar Y 14.2 12.5 9.5 6.2 5.01 4.02 3.99
Aşağıdakilerden hangisi yanlıştır?
a) Yukarıdaki veriler bağımlı değişkenin varyanslarıdır.
b) Yukarıdaki veriler rassal hata teriminin varyanslarıdır.
c) X’in değeri arttıkça bağımlı değişkenin varyansı küçülür.
d) X’in değeri arttıkça rassal hatanın varyansı küçülür.
e) Hata teriminin varyansı tahmin edilen parametrenin değerine göre küçülür.
7. Aşağıdaki verilere göre modelde değişen varyansın tespiti için spearman sıra
korelasyon testi uygulanmıştır.
Gözlem 1 2 3 4 5 6 7 8 9
Y 2 3 4 6 10 20 19 15 22
X 1 5 4 10 9 8 12 17 14
ˆiu -0.38 -0.85 0.52 0.33 0.68 -0.3 -1.07 0.22 -1.71
0.05 anlamlılık seviyesinde Aşağıdakilerden hangisi yanlıştır.
a) 2 114id
b) 5id
c) Spearman sıra korelasyon katsayısının değeri 0.05’dir.
d) Test istatistiğinin değeri 2.65’dir.
e) 2.65> tc= 2.365 olduğu için değişen varyansın varlığı kabul edilir.
8. 1970-1983 arası yıllık veriler kullanılarak GSYİH ve para arzı arasındaki
ilişki aşağıdaki gibi tahmin edilmiştir. 2ˆ 158.78 1.203 2 0.9943
ˆ( ) (43.04) (0.026)i
GSMH M r
Se
Değişen varyansın tespiti amacıyla aşağıdaki yardımcı regresyon tahmin edilmiştir. 2 2 2ˆ 1347.718 3.654 2 0.0027 2 0.675
ˆ( ) (5367.136)(7.1934) (0.0021)i
u M M R
Se
Aşağıdakilerden hangisi yanlıştır.
349
a) 0 0 1 2: 0H ,
0 0 1 2: 0H
b) White testi uygulanmaktadır.
c) Test istatistiğinin değeri 9.45’e eşittir.
d) Tablo değeri 2
0.95,25.99
e)
2 2
0.95,29.45 5.99 değişen varyansın varlığı kabul edilir.
9. Goldfeld-Quandt testinin temel ve alternatif hipotezleri ile test istatistiği
aşağıdakilerden hangisidir?
a) 2 2 2 2 2 2
0 1: ; : ;B K B K B KH H F
b) 2 2 2 2 2 2
0 1: ; : ;B K B K B KH H t
c) 2 2 2 2 2 2 2
0 1: ; : ;B K B K B KH H
d) 2 2 2 2 2 2
0 1: ; : ;B K B K B KH H t
e) 2 2 2 2 2 2
0 1: ; : ;B K B K B KH H F
10. 2ˆ 37.21 8B Bu n ve 2ˆ 78.06 8K Ku n ise Goldfeld-Quandt testinin test
istatistiğinin değeri aşağıdakilerden hangisidir?
a) 0.48
b) 2.10
c) 5.92
d) 1.93
e) 0.71
Cevaplar
1) a
2) b
3) e
4) e
5) d
6) e
7) e
350
8) b
9) a
10) a
351
13. ÇOKLU DOĞRUSAL BAĞLANTI
352
Bu Bölümde Neler Öğreneceğiz?
13.1. Çoklu Doğrusal Bağlantı Sebepleri
13.2. Çoklu Doğrusal Bağlantının Dereceleri
13.3. Çoklu Doğrusal Bağlantının Sonuçları
13.4. Çoklu Doğrusal Bağlantının Tespiti
353
Bölüm Hakkında İlgi Oluşturan Sorular
1) Çoklu doğrusal bağlantı ne demektir?
2) Çoklu doğrusal bağlantı ne gibi problemlere yol açmaktadır?
3) Çoklu doğrusal bağlantı nasıl tespit edilir?
4) Çoklu doğrusal bağlantı durumunda ne yapılmalıdır?
354
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde edileceği
veya geliştirileceği
Çoklu Doğrusal
Bağlantı Sebepleri
Çoklu doğrusal bağlantının ne
anlama geldiğini ve tam çoklu
doğrusal bağlantının varlığı
halınde EKK tahmincilerinin
özelliklerini kavramak
Ders notları
Çoklu Doğrusal
Bağlantının Tespiti
VIF katsayısının
hesaplanabilmesi
Ders notları, uygulamaları tekrar
etmeli
355
Anahtar Kavramlar
Tam çoklu doğrusal bağlantı,
Varyans büyütme faktörü (VİF)
356
Giriş
Klasik doğrusal regresyon modellinde yer alan 2 ve ya daha fazla bağımsız değişkenin
doğrusal bağlantılı olmadığı varsayılmıştır. Bundan bir sapma olduğunda diğer bir ifade ile
bağımsız değişkenler arasında doğrusal bir bağlantının varlığı çoklu doğrusal bağlantı
problemini göstermektedir. Çoklu doğrusal bağlantı 2 değişken arasında olabileceği gibi 3, 4
ve ya daha fazla değişken arasında olabilir. Çünkü iktisadi değişkenler hep aynı şeylerden
etkilenmektedir.
0 1 1 2 2 .......i k kY X X X u
Böyle bir modelde tam çoklu doğrusal bağlantı olma koşulu;
0 0 1 1 2 2 ....... 0k kX X X ile mümkündür. 0’dan k’ya kadar olan değişkenleri öyle
sayılarla çarpalım ve toplayalım ki toplam 0 olsun. Bu şart gerçekleşiyorsa modelde tam çoklu
doğrusal bağlantı vardır. (0 1 2 ....... 0k )
0 1 1 2 2i i i iY X X u modelinde kullanılan bağımsız değişkenlerin değerleri aşağıda
verilmiştir.
X1 X2
10 50
15 75
18 90
24 120
30 150
1 10 50
1 15 75
1 18 90
1 24 120
1 30 150
X
1ˆ ( ' ) 'X X X Y
357
Anlaşılacağı gibi değişkenler arasında bir ilişki söz konusudur.
2 1
2 15
X X
X X
Burada olduğu gibi 2 değişken birbiri ile tam ilişkili ise çoklu doğrusal bağlantı söz konusudur.
Bu tam çoklu doğrusal bağlantıdır.
12 1r : 2 değişken arasında korelasyon katsayısı 1’e eşittir. Böyle bir durumda ’leri
bulamayız. Çünkü ( ' )X X matrisinin determinantı 0’dır. Bu nedenle tersini alamayız. Buna
bağlı olarak da ’lar tahmin edilemez.
Çoklu doğrusal bağlantı şüphesiz zaman serilerinde ortaya çıkar ama kesit verilerinde de ortaya
çıkabilir. Büyük bir işletmenin de küçük bir işletmenin de üretimleri kullanılan emek ve
sermayeye bağlıdır. Büyük işletme daha çok emek ve sermaye kullanır. İşletme büyüdükçe
sermaye ve emek de büyür. Bu kesit verisi olmasına rağmen sermaye ve emek arasında ilişki
söz konusudur.
Çoklu doğrusal bağlantı iki yönü ile otokorelasyon ve heteroskedasiteden farklıdır:
- Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite de olabilir
fakat çoklu doğrusal bağlantı söz konusu değildir. Diğer bir ifade ile otokorelasyon ve
heteroskedasite basit ve çoklu regresyon modelleri ile ilgili olduğu halde çoklu doğrusal
bağlantı sadece çok değişkenli regresyon modellerine özgüdür.
- Otokorelasyon ve heteroskedasite anakütle ile ilgilidir. Çoklu doğrusal bağlantı ise
örnekle ilgili bir sorundur. Yani çoklu doğrusal bağlantı istatistiksel bir problem olmayıp
verilerdeki yetersizliklerden meydana gelmektedir. Ele alınan dönemde 2 ve ya daha fazla
değişken birlikte değişme eğiliminde olabilir. Çoklu doğrusal bağlantıdan kurtulmanın bir yolu
da gözlem sayısını arttırmaktır.
358
13.1. Çoklu Doğrusal Bağlantının Sebepleri
Çoklu doğrusal bağlantıya sebep olan unsurlar aşağıdaki sıralanmaktadır:
1) Modelde yer alan bağımsız değişkenlerin aynı trende sahip olmaları:
İktisadideğişkenlerin zaman içinde birlikte değişme eğilimleri vardır. Çünkü genellikle aynı
unsurlardan etkilenirler. Dolayısıyla herhangi bir iktisadi olay sonucunda iktisadi değişkenler
gecikmeli de olsa aynı davranış kalıbı içinde değişiklik gösterirler. Ör: İktisadi gelişme
dönemlerinde gelir, tüketim, istihdam ve yatırımlar artma eğilimindedir. Daralma dönemlerinde
ise bu değişimin tersi bir davranış kalıbına girerler. Zaman serilerindeki büyüme ve genel eğilim
çoklu doğrusal bağlantının en önemli nedenlerindendir.
2) Veri tabanının yeteri kadar geniş tutulmaması nedeniyle bazı bağımsız değişkenlerin
beraberce değişmeleri
3) Modelde bağımsız değişkenlerin trend etkisine tabi olan bir gecikmeli değişkenin
bulunması
0 1 2 1t t tC Y Y
Aynı trende sahip gelir değişkenlerinin arasında çoklu doğrusal bağlantı söz konusudur.
13.2. Çoklu Doğrusal Bağlantının Dereceleri
i-Değişkenler arasında kuvvetli bir ilişkinin olması
0 1 1 2 2 .......i k kY X X X u , 1X ve
2X arasında kuvvetli bir çoklu doğrusal
bağlantı varsa 12r 1’ yakın bir değerdir. Modeli EKK yöntemiyle çözdüğümüzü düşünelim.
1
1
ˆ Y
X
, 2
2
ˆ Y
X
İki değişken arasında böyle 1’e yakın çoklu doğrusal bağlantı varsa EKK yöntemiyle tahmin
edilen 1 ve 2 güvenilir olmayacaktır. 1 sadece 1X ’in değil 2X ’nin de kendine yüklediği
görevi ifade edecektir.
359
ii-Tam çoklu doğrusal bağlantı
Modelde tam çoklu doğrusal bağlantı varsa yani 2 değişken arasındaki basit korelasyon
katsayısı 1’ eşitse daha önce de ifade edildiği gibi ( ' )X X matrisinin determinantı 0 olacaktır.
Tam çoklu doğrusal bağlantı demek ( ' )X X matrisinde 2 ve ya daha fazla vektörün birbiri ile
doğrusal olarak bağlantılı olması demektir. Matris-determinant ilişkisine göre 2 vektörü birbiri
ile ilişkili olan bir matrisin determinantı 0’dır ve dolayısıyla tersi alınamaz. Böylece modelin
parametreleri tahmin edilemez. Eğer modelde tam değil fakat kuvvetli bir çoklu doğrusal
bağlantı varsa bu durumda determinant 0’a yaklaşacak ve ( ' )X X matrisinin elemanları çok
büyük değer alacaktır. Bunun sonucu ise Varyans-kovaryans matrisindeki elemanları
büyümesidir.
0
1
2
( )
( )
( )
Var
Var kov Var
Var
2 1ˆ( ) ( ' )Var Kov X X
Varyanslarda meydana gelecek büyüme dolayısıyla standart hatalar da büyüyecektir. Böylece
hesaplanmış t hesap değeri küçülecektir. Aslında bir bağımsız değişken, bağımlı değişken
üzerinde çok etkili olabilir ama t testleri sonucu anlamsız çıkabilmektedir.
iii.Değişkenler arasında ilişki olmaması
2 bağımsız değişken arasında ilişki yoksa korelasyon katsayısı 0’dır. Korelasyon katsayısının 0
olması, kovaryansın 0 olması durumunda mümkündür. Eğer modelde çoklu doğrusal bağlantı
yoksa ( ' )X X matrisi diyagonel bir karaktere sahiptir.
1
2
3
0 0
( ' ) 0 0
0 0
X X
1
1
2
3
1 0 0
( ' ) 0 1 0
0 0 1
X X
Böyle bir model; kovaryansızhomoskedasite ve ya heteroskedasite özelliğine sahiptir.
360
13.3. Çoklu Doğrusal Bağlantının Sonuçları
-Regresyon denklemindeki parametrelerin değerlerinin belirsiz olması
-Parametrelerin varyanslarının ve dolayısıyla güven aralıklarının büyümesi
-Hesaplanan t hesap değerlerinin küçülmesi
-R2’nin olduğundan fazla büyümesi
-Tahmin edilen parametrelerin ve standart hatalarının verilerdeki küçük değişikliklerden önemli
derecede etkilenmesi
0 1 1 2 2 3 3
1 2 3
ˆ ˆ ˆ ˆ
ˆ ˆ ˆ( ) ( ) ( )
Y X X X u
Se Se Se
modelinden R2 hesaplanmış olsun ve F testinde bütün parametreler 1 2 3ˆ ˆ ˆ, , birlikte test
edildiğinde anlamlı çıkarken, t testi ile parametreler tek tek test edildiğinde anlamsız
çıkabilirler. Bu durum tipik bir çoklu doğrusal bağlantı örneğidir. Tahmin edilen parametreler
hakkında 0.05 önem derecesi ile yapılan F ve t testleri önemli bir bilgi vermektedir.
Modelde yer alan bağımsız değişkenlerin topluca bağımlı değişken üzerinde etkili olup
olmadığını gösteren F testinin olumlu sonuç vermesi R2’nin güvenilir olduğunun bir
göstergesidir. Buna karşılık değişkenlerin Y üzerindeki etkisini tek tek test eden t testi sonuçları
olumsuzsa, bu durumda modelde çoklu doğrusal bağlantıdan şüphe edilir. Çoklu doğrusal
bağlantı durumunda tahmin edilen parametrelerin standart hataları büyüktür fakat tahmin edilen
parametreler eğilimsizdirler.
13.4. Çoklu Doğrusal Bağlantının Tespiti
1- Modelde çok yüksek bir R2hesaplandığı halde regresyon modelindeki parametrelere
uygulanan t testlerinin anlamsız sonuç vermesi çoklu doğrusal bağlantının en belirgin
özelliğidir. R2değeri büyük olduğundan F testi olumlu sonuç verecektir.
2- Çoklu doğrusal bağlantının derecesinin tespitinde diğer bir yol ( ' )X X matrisinin
determinantının hesaplanmasıdır. ' 0X X ise tam çoklu doğrusal bağlantı vardır ve ’lar
hesaplanamaz. ' 0X X ’a yaklaşırsa kuvvetli bir çoklu doğrusal bağlantı halini ifade
etmektedir.
361
3- 0 1 1 2 2ˆ ˆ ˆY X X u modelinde yer alan değişkenler arasındaki basit korelasyon
katsayılarına bakarak da çoklu doğrusal bağlantının olup olmadığı konusunda fikir sağlanabilir.
rY1=Bağımlı değişken ile 1. bağımsız değişken arasındaki korelasyon katsayısı,
rY2=Bağımlı değişken ile 2. bağımsız değişken arasındaki korelasyon katsayısı,
r12=2 bağımsız değişken arasındaki korelasyon katsayısı olduğunda
r12>rY1ver12>rY2 ise 1X ve
2X arasında çoklu doğrusal bağlantı vardır.
4- Belirginlik katsayısının kullanılması: Modelden bir bağımsız değişken çıkarıldığında R2çok
az değişiyorsa çoklu doğrusal bağlantıdan şüphelenilir.
5- Varyans büyütme faktörü (VİF): Varyans büyütme faktörü kullanılarak parametre
tahminlerinin ve varyanslarının çoklu doğrusal bağlantı nedeniyle gerçek değerinden ne kadar
uzaklaştığı belirlenmektedir.
r12= 1X ve
2X arasındaki basit korelasyon katsayısı.
12
1
1VİF
r
olarak hesaplanmaktadır.
r12=0 ise VİF=1 1X ve 2X arasında ilişki yoktur.
r12=1 ise VİF=∞ 1X ve 2X arasında ilişki vardır.
Bunu daha fazla geliştirebiliriz. Elimizde k tane bağımsız değişken varsa, k tane de R2 vardır.
Buna göre de k tane varyans büyütme faktörü (VİF) hesaplanır.
1 2
2
. , ...
1
1i kX X X X
VİFR
5var .
10
VİFçoklu doğrusal bağlantı dır
VİF
Çoklu doğrusal bağlantı arttıkça, VİF faktörü büyümektedir.
362
Uygulamalar
363
Uygulama Soruları
1) Çoklu doğrusal bağlantı nedir?
Klasik doğrusal regresyon modellinde yer alan 2 veya daha fazla bağımsız değişkenin
doğrusal bağlantılı olmadığı varsayılmıştır. Bundan bir sapma olduğunda diğer bir ifade
ile bağımsız değişkenler arasında doğrusal bir bağlantının varlığı çoklu doğrusal
bağlantı problemini göstermektedir
2) Çoklu doğrusal bağlantı hangi yönleriyle otokorelasyon ve heteroskedasiteden
ayrılmaktadır?
(i) Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite de olabilir
fakat çoklu doğrusal bağlantı söz konusu değildir. Diğer bir ifade ile otokorelasyon ve
heteroskedasite basit ve çoklu regresyon modelleri ile ilgili olduğu halde çoklu doğrusal
bağlantı sadece çok değişkenli regresyon modellerine özgüdür.
(ii) Otokorelasyon ve heteroskedasite anakütle ile ilgilidir. Çoklu doğrusal bağlantı ise
örnekle ilgili bir sorundur. Yani çoklu doğrusal bağlantı istatistiksel bir problem
olmayıp verilerdeki yetersizliklerden meydana gelmektedir. Ele alınan dönemde 2 ve
ya daha fazla değişken birlikte değişme eğiliminde olabilir. Çoklu doğrusal bağlantıdan
kurtulmanın bir yolu da gözlem sayısını arttırmaktır.
3) Çoklu doğrusal bağlantının sebepleri nelerdir?
- Modelde yer alan bağımsız değişkenlerin aynı trende sahip olmaları
- Veri tabanının yeteri kadar geniş tutulmaması nedeniyle bazı bağımsız değişkenlerin
beraberce değişmeleri
- Modelde bağımsız değişkenlerin trend etkisine tabi olan bir gecikmeli değişkenin
bulunması
4) Değişkenler arasında tam çoklu doğrusal bağlantı olması halinde parametrelerin
niçin tahmin edilemediğini anlatınız.
2 1
2 15
X X
X X
Burada olduğu gibi 2 değişken birbiri ile tam ilişkili ise çoklu doğrusal bağlantı söz
konusudur. Bu tam çoklu doğrusal bağlantıdır.
364
12 1r : 2 değişken arasında korelasyon katsayısı 1’e eşittir. Böyle bir durumda ’leri
bulamayız. Çünkü ( ' )X X matrisinin determinantı 0’dır. Bu nedenle tersini alamayız.
Buna bağlı olarak da ’lar tahmin edilemez.
5) Çoklu doğrusal bağlantıyı tespit etme yöntemleri nelerdir?
çok yüksek bir R2 , t testlerinin anlamsız sonuç vermesi, r12>rY1ver12>rY2 , Modelden bir
bağımsız değişken çıkarıldığında R2çok az değişiyorsa çoklu doğrusal bağlantıdan
şüphelenilir.
6) Aralarındaki basit korelasyon katsayısı 0.33 olan iki değişken arasında çoklu doğrusal
bağlantı olup olmadığını araştırınız.
r12=0,33
12
1
1
11,49
1 0,33
1,49 5
VİFr
VİF
çoklu doğrusal bağlantı sorun teşkil etmeyecektir.
365
Bu Bölümde Ne Öğrendik Özeti
Bu bölümde, çoklu doğrusal bağlantının tanımı, sebepleri, dereceleri ile tespit etme
yöntemleri anlatılmıştır.
366
Bölüm Soruları
1) “Çoklu doğrusal bağlantı…………………………………………. özgü,
………………….ile ilgili bir sorundur.” İfadesindeki boşlukları doldurunuz.
a) Doğrusal olmayan modellere ; anakütle
b) Modelin parametrelerine ; örnek
c) Model dışında kalan değişkenlere; anakütle
d) Modelin parametrelerine; anakütle
e) Çok değişkenli regresyon modellerine; örnek
2) 2 bağımsız değişken arasında korelasyon katsayısı 1’e eşit ise aşağıdaki ifadelerden
hangisi doğrudur?
a) Böyle bir durumda ’leri bulunur, çünkü ( ' )X X matrisinin determinantı 0 değildir
b) Böyle bir durumda ’leri bulunur, çünkü ( ' )X X matrisinin determinantı 0’dır.
c) Böyle bir durumda ’leri bulanamaz, çünkü ( ' )X X matrisinin determinantı 0’dır.
d) Böyle bir durumda ’leri bulunamaz, çünkü ( ' )X X matrisinin determinantı 0
değildir.
e) Böyle bir durumda ’leri bulunamaz, çünkü ( )X matrisinin determinantı 0’dır.
3) Aşağıdaki ifadelerden hangisi doğrudur?
a) Basit bir regresyon modelinde otokorelasyon olmayacak, heteroskedasite olabilir
fakat çoklu doğrusal bağlantı söz konusu değildir.
b) Basit bir regresyon modelinde otokorelasyon olmayacak, heteroskedasite de
olmayacak, fakat çoklu doğrusal bağlantı söz konusu değildir.
c) Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite olmayacak,
fakat çoklu doğrusal bağlantı söz konusu değildir.
d) Basit bir regresyon modelinde otokorelasyon, heteroskedasite ve çoklu doğrusal
bağlantı söz konusu değildir.
e) Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite de olabilir
367
fakat çoklu doğrusal bağlantı söz konusu değildir.
4) Aşağıdakilerden hangisi çoklu doğrusal bağlantının sonuçlarından biri değildir?
a) Regresyon denklemindeki parametrelerin değerlerinin belirsiz olması
b) Parametrelerin varyanslarının ve dolayısıyla güven aralıklarının büyümesi
c) Hesaplanan t hesap değerlerinin küçülmesi
d) R2’nin olduğundan fazla büyümesi
e)Tahmin edilen parametrelerin ve standart hatalarının verilerdeki küçük
değişikliklerden önemli derecede etkilenmemesi
5) Aşağıda verilmiş olan ifadelerden hangisi doğrudur?
a) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları
küçüktür fakat tahmin edilen parametreler eğilimlidir.
b) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları
küçüktür fakat tahmin edilen parametreler eğilimsizdirler.
c) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları
büyüktür fakat tahmin edilen parametreler eğilimlidir.
d) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları
büyüktür fakat tahmin edilen parametreler eğilimsizdirler.
e) Çoklu doğrusal bağlantı durumunda parametreleri tahmin edilemez
6) 0 1 1 2 2i i i iY X X u modelinde kullanılan bağımsız değişkenlerin değerleri aşağıda
verilmiştir.
X1 X2
2 10
1,5 7,5
1,8 9
2,4 12
3 15
368
Buna göre aşağıdaki ifadelerden hangisi doğrurdur?
a) ' 0X X , çoklu doğrusal bağlantı vardır ve ’lar hesaplanamaz.
b) ' 0X X tam çoklu doğrusal bağlantı yoktur ve ’lar hesaplanamaz.
c) ' 0X X tam çoklu doğrusal bağlantı vardır ve ’lar hesaplanır.
d) ' 0X X tam çoklu doğrusal bağlantı vardır ve ’lar hesaplanamaz.
e) ' 0X X tam çoklu doğrusal bağlantı yoktur ve ’lar hesaplanamaz.
7) 0 1 1 2 2i i i iY X X u
modelinde r12=0,95 olmak üzere aşağıdaki ifadelerden
hangisi doğrudur?
a) VİF=1 1X ve
2X arasında ilişki yoktur.
b) VİF=2 1X ve
2X arasında ilişki yoktur.
c) VİF=4 1X ve
2X arasında ilişki yoktur.
d) VİF=10 1X ve
2X arasında ilişki vardır.
e) VİF=20 1X ve 2X arasında ilişki vardır.
8) 0 1 1 2 2i i i iY X X u modelinde r12=0,05 olmak üzere aşağıdaki ifadelerden
hangisi doğrudur?
a) VİF=1.05 1X ve
2X arasında ilişki yoktur.
b) VİF=2.05 1X ve
2X arasında ilişki yoktur.
c) VİF=4.05 1X ve
2X arasında ilişki yoktur.
d) VİF=10.05 1X ve 2X arasında ilişki vardır.
e) VİF=20.05 1X ve 2X arasında ilişki vardır.
369
9) 0 1 1 2 2i i i iY X X u
modeli için aşağıdaki ifadelerden hangisi doğrudur?
a) r12>rY1 ve r12>rY2 ise 1X ve
2X arasında çoklu doğrusal bağlantı vardır.
b) r12>rY1 ve r12<rY2 ise 1X ve
2X arasında çoklu doğrusal bağlantı vardır.
c) r12<rY1 ve r12>rY2 ise 1X ve
2X arasında çoklu doğrusal bağlantı vardır.
d) r12>rY1 ve r12>rY2 ise 1X ve
2X arasında çoklu doğrusal bağlantı yoktur.
e) r12<rY1 ve r12<rY2 ise 1X ve
2X arasında çoklu doğrusal bağlantı vardır.
10)
2
2
110 0, 0,
. .(0
15 13
66) (0,18) (0,18)
0,96
,
i i iY X X
R
s e
modeli için aşağıdaki ifadelerden hangisi doğrudur?
a) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamsız sonuç vermesi
çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri büyük olduğundan F testi olumlu
sonuç verecektir.
b) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamsız sonuç vermesi
çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri küçük olduğundan F testi olumsuz
sonuç verecektir.
c) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamsız sonuç vermesi
çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri büyük olduğundan F testi olumsuz
sonuç verecektir.
d) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamlı sonuç vermesi
çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri büyük olduğundan F testi olumlu
sonuç verecektir.
e) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamlı sonuç vermesi
çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri küçük olduğundan F testi olumsuz
sonuç verecektir.
370
Cevaplar
1)e
2)c
3)e
4)e
5)d
6)b
7)e
8)a
9)a
10)a
371
14. SPESİFİKASYON HATALARI
372
Bu Bölümde Neler Öğreneceğiz?
14.1. Modelin Büyüklüğü İle İlgili Hatalar
14.2. Modelin Matematiksel Kalıbı İle İlgili Hatalar
14.3. Ölçme Hataları
373
Bölüm Hakkında İlgi Oluşturan Sorular
1) Ekonometrik bir modelin spesifikasyonunda ne gibi hatalar çıkmaktadır?
2) Modelin büyüklüğüne ilişkin yapılan hatalar nelerdir?
3) Modelin matematiksel kalıbı ile ilgili hatalar neler olabilecektir?
4) Değişkenlerdeki yapılabilecek ölçme hataları nelerdir?
374
Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri
Konu Kazanım Kazanımın nasıl elde edileceği
veya geliştirileceği
Spesifikasyon
Hataları
Ekonometrik bir modelin
spesifakasyonun belirlenmesi
noktasında nasıl bir yol
izlenmesi gerekliliği kazanımı
Ders notları
Spesifikasyon
Hataları
Modelin büyüklüğünün tespit
edilmesi
Ders notları, uygulamaları tekrar
etmeli
375
Anahtar Kavramlar
Model spesifikasyonu
Model kurma hatası
Modelin matematiksel kalıbı
Ölçme hataları
376
Giriş
Bu kısımda, ekonometrik bir model oluştururken bilerek ya da bilmeyerek yapmış
olduğumuz model kurma hataları incelenecektir. Söz konusu hatalara ne şekilde düşülebileceği
üzerinde durulacak ve tespit etme yöntemlerine değinilecektir.
377
14.1. Modelin Büyüklüğü İle İlgili Hatalar
Modelin büyüklüğü ile ilgili olan hatalarda modele gereksiz bir değişken ilave edilmiş
olabilir ya da model üzerinde etkisi olan gerekli bir değişken dışlanmış olabilir.
0 1 1 2 2ˆ ˆ ˆY X X u şeklinde olması gereken bir modelde bilerek yada bilmeyerek
2X
değişkenini model dışında bıraktığımızı ve
0 1 1ˆ ˆY X e
olarak tahmin ettiğimizi düşünelim. 1X ve
2X arasında bir bağlantı ve2X ’yi model dışında
bırakmışsak 2. regresyon denklemindeki1X ;
2X ’nin etkisini de göstermektedir. 0 ve
1
eğilimlidir. Çünkü 1X ,
2X ’nin de etkisini üstlenecektir ve 1 ’nin beklenen değeri 1 ’e eşit
olmayacaktır.
0 0ˆˆ( )E ,
1 1ˆˆ( )E
Böyle bir durumda gözlem sayısı artmış olsa dahi eğilimlilik giderilemez, düzeltilemez.
r12=0 ise bu durumda 1 eğilimsizdir fakat
0 eğilimlidir. Bir değişkeni model dışında
bırakırsak bundan dolayı anakütle hata terimi varyansı da yanlış tahmin edilmektedir.
2ˆˆ
u
n k
Model dışında bırakılan değişken hem 2u ’nin hem de (n-k) değerinin yanlış belirlenmesine
sebep olmaktadır.
2
1 2
1 12
ˆˆ( )(1 )
Sex r
,
2
1 2
1
ˆˆ( )Se
x
Modelde dışlanmış bir değişken varsa tahmin edilen 1 ’in varyansı dolayısıyla standart hataları
eğilimlidir. Yani 1 ’in standart hatasından farklıdır. Standart hataların kullanıldığı hipotez
testleri ve güven aralıkları yanıltıcı sonuçlar vermektedir. Çünkü kalıntıların kareleri toplamı
ve serbestlik dereceleri farklı olmaktadır. Özetlemek gerekirse, modelde dışlanmış bir değişken
378
olması dolayısıyla tahmin edilen parametreler eğilimli ve tutarsız olmaktadır. 2u ve(n-k)
serbestlik derecesi yanlış belirlendiğinden anakütle hata terimi varyansı da yanlış tahmin
edilmektedir. Güven aralıkları ve hipotez testleri yanıltıcıdır. Az değişkenle tahmin edilmiş
küçük modelin standart hataları daha büyük olmaktadır.
Bunun yanı sıra modele gereksiz bir değişken eklenmesi durumu da spesikasyon hatasına sebep
olmaktadır.
0 1 1ˆ ˆY X e şeklinde oluşturulması gereken bir modele gereksiz bir değişken ilave edip;
0 1 1 2 2ˆ ˆ ˆY X X u modelini tahmin etmiş olabiliriz. Bu durumda tahmin edilen
parametreler eğilimsiz ve tutarlıdır.
0 0ˆˆ( )E ,
1 1ˆˆ( )E
Anakütle hata terimi varyansı doğru tahmin edilmiştir. Güven aralıkları ve hipotez testleri
güvenilirdir. Fakat 2. modelin varyansları dolayısıyla standart hataları 1. modelden daha
büyüktür.
1 1
1 1
ˆˆ( ) ( )
ˆˆ( ) ( )
Var Var
Se Se
Modele gereksiz bir değişken ilave edildiğinde söz konusu değişkenin anlamlılığının t testi ile
sınanması gereklidir.
0 1 1 2 2ˆ ˆ ˆY X X u şeklinde oluşturulmuş modeli ele alırsak; X2 değişkeninin modelde
yer alıp almamasına karar verebilmek için2 ’nin istatistiksel olarak anlamlı olup olmadığını
araştırmalıyız.
0 2
1 2
ˆ: 0
ˆ: 0
H
H
2 parametresi anlamlı iseX2 değişkenimodelde yer almalıdır. 2 anlamsız iseX2
değişkenimodelde yer almamalıdır.
Örnek 1: Aşağıdaki modelde yer alan X2değişkeninin ilave edilmesinin gerekli olup olmadığını
sınayınız?
379
2
1 26955.495 5.22 4.55 0.928
: ( 2.35) (11.39) ( 0.34)
Y X X R
t
X2değişkeninin anlamlılığını test etmemiz gerekmektedir.
0 2
1 2
: 0
: 0
H
H
(0.05;12)
0.34
2.179
hesapt
t
; 0 :hesap tablot t H kabul
Modele ilave edilmiş değişken istatistiksel olarak anlamsız çıktığından dolayı X2
değişkeninin gereksiz bir değişken olduğu söylenebilmektedir.
14.2. Modelin Matematiksel Kalıbı İle İlgili Hatalar
Model kurma hatasına sebep olan diğer bir hata türü ise modelin matematiksel kalıbı ile ilgilidir.
Doğrusal olarak kurulması gereken bir modeli;
0 1 1ˆ ˆY X e
bilerek ya da bilmeyerek kareli olarak kurduğumuzu düşünelim.
2
0 1 1 2 1ˆ ˆ ˆY X X v
Böyle bir durumda da model kurma hatasına düşmüş sayılırız. Böyle bir hataya düşmemek için
değişkenler arasındaki ilişkiye doğru bir şekilde karar vermemiz gerekmektedir.
Dışlanmış değişkenler ve yanlış fonksiyonel kalıp için sınamalar
Düzeltilmiş 2R ( 2R ) değerleri yüksek, t değerleri anlamsız, parametrelerin işaretleri yanlış ve
Durbin Watson istatistiği modelde otokorelasyon olduğunu gösteriyorsa önemli bir değişken
modelden dışlanmıştır ya da modelin matematiksel kalıbı yanlış belirlenmiştir. Bunu sınamak
için kullanılan yöntemler aşağıdaki gibidir.
1-Kalıntıların incelenmesi:
380
Eğer modelden önemli bir değişken dışlanmış ya da matematiksel kalıp yanlış belirlenmişse
kalıntıların grafiği gelişigüzel dağılmayacaktır yani belirli bir görüntü sergileyecektir.
Kalıntılar 0 ekseni etrafında gelişigüzel dağılmalıdır. Eğer böyle değilse kalıntılar birbiri ile
ilişkili olacak ve otokorelasyon ortaya çıkacaktır.
Örnek: Aşağıda verilmiş iki modelden birinin matematiksel formunun yanlış belirlenmiş
olduğunu düşünelim.
1) 2
0 1 1 2 1Y X X v
2) 2 3
0 1 1 2 1 3 1Y X X X e
Bu modellere ait kalıntılar aşağıdaki gibidir.
381
1.modelde kalıntılar hem 0’dan farklı değerler izlemekte hem de belli bir görüntü
sergilemektedir. Hâlbuki istenen durum kalıntıların gelişigüzel dağılmasıdır. 2.modeldeki
kalıntılar ise 0 etrafında rastgele bir dağılım izlemektedir. Böyle bir durumda 2. modelin
matematiksel kalıbının doğru olduğu söylenebilmektedir.
2-Durbin Watson istatistiği:
0 1 1 2 2ˆ ˆ ˆY X X u şeklinde tahmin edilmesi gereken bir modeli gerekli bir değişkeni
dışlayarak;
0 1 1ˆ ˆY X e
şeklinde kurmuş olabiliriz. Model kurma hatası olup olmadığını tespit etmek için daha önce
otokorelasyonun test edilmesi yöntemlerinde anlatılmış olan Durbin-Watson testi ile sınamak
mümkündür. Bunun için takip edilmesi gereken aşamalar aşağıdaki gibidir:
- 2.model tahmin edilir ve kalıntıları hesaplanır.
- Hata terimleri X2 değişkeninin değerlerine göre küçükten büyüğe doğru sıralanır.
Diğer bir ifade ile X2 değişkeni ile kalıntılar birlikte sıralanır.
- Sıralanmış olan bu kalıntılardan hareketle DW istatistiği elde edilir.
2
1
2
2
1
ˆ ˆ( )
ˆ( )
t n
t t
t
t n
t
t
u u
DW
u
=
-
=
=
=
-
=å
å
- DW değeri DW tablosuna göre anlamlı ise model yanlış kurulmuştur.
382
0
1
:
:
H Model doğru kurulmuştur
H Model yanlış kurulmuştur
Örnek:
2
0 1 1 2 1 modY X X v Kısıtlı el
2 3
0 1 1 2 1 3 1 modY X X X e Kısıtsız el
Öncelikle kısıtlı modeli EKK ile tahmin ediyoruz.
2
1 1
2
222.383 8.02 2.54 10
: (9.468) ( 0.818) (2.925) 0.92
Y X X n
t R
1X ve 2
1X değerleri yerine koyulup Y değerleri elde edilir. ˆ( )Y Y ’den de kalıntılar elde edilir.
Kalıntılar modelden dışlanmış olan 3
1X değişken değerlerine göre sıralanır. Sıralanmış olan
kalıntılar kullanılarak DW istatistiği hesaplanır.
0.67DW
0
1
:
:
H Model doğru kurulmuştur
H Model yanlış kurulmuştur
Modelde pozitif otokorelasyonun bulunması 0H hipotezinin reddedildiğini göstermektedir.
Dolayısıyla model kurma hatası söz konusudur.
3-Ramsey-Reset testi:
Model kurma hatasının olup olmadığını test etmek için kullanılan bir diğer yöntem Ramsey-
Reset testidir. Testin aşamaları aşağıdaki gibidir:
383
0 1 1 modY X v Doğrusal el
- Ele alınan model tahmin edilir ve Y değerleri eldeedilir.
- Kalıntıların Y değerlerine göre grafiği çizilir.
Elde edilen bu grafiğe göre Y’nin kareli ve küplü değerleri de modele katılarak yeni bir model
oluşturulur ve tahmin edilir.
Yeni model: 2 3
0 1 1 2 3Y X Y Y e
Eski model:0 1 1Y X v
- Yeni eklenen bu yeni değişkenlerin 2R ’yi anlamlı şekilde arttırıp arttırmadığı F
testi ile sınanır.
2 2
21
yeni eski
yeni
R R mF
R n k
Buradaki m: yeni ilave edilen bağımsız değişken sayısıdır. n gözlem sayısı olup, k ise yeni
modeldeki parametre sayısını ifade etmektedir.
- 0
1
:
:
H Model doğru kurulmuştur
H Model yanlış kurulmuştur
Hesaplanan F istatistiği, m ve (n-k) serbestlik dereceli F tablo değerleri ile karşılaştırılır. F
istatistiği kritik değerden büyükse 0H hipotezi reddedilir. Yani model yanlış kurulmuştur.
Örnek:
2
1166.467 19.93 10 0.84Y X n R
384
Model tahmininden elde edilmiş Y değerleri hesaplanmıştır ve Y değerleri ile kalıntıların
grafiği çizilmiştir.
Y’nin kareli ve küplü terimleri modele ilave edilmiştir. Eğer grafik parabol olmuş olsaydı
sadece Y’nin kareli değerlerini ilave etmemiz yeterli olurdu.
Yeni model: 2 3 2
1ˆ ˆ2140.72 476.6 0.09 0.001 0.99Y X Y Y R
Bu modele F testi uygulanır.
2 2
(0.05,2,6)2
0.99 0.84 2284.4 , : 5.14
1 0.99 10 41
yeni eski
yeni
R R mF F
R n k
F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model yanlış kurulmuştur.
(1. model yanlış kurulmuştur, model doğrusal olmamalıdır).
14.3. Ölçme Hataları
Bağımlı ve bağımsız değişkenlere ait verilerde hesaplama, yuvarlama, ara değer verme vb.
nedenlerle ölçme hataları ile karşılaşılmaktadır.
-Bağımlı değişkende ölçme hataları:
Bu kısımda, bağımlı değişken Y’de herhangi bir nedenle ölçme hatası varsa yani Y , *Y olarak
hesaplanmışsa bunun sonuçlarının ne olacağı üzerinde durulacaktır.
*
0 1 1Y X u
şeklindeoluşturulmuş bağımlı değişkeninde ölçme hatası olan bir model olduğunu düşünelim.
buna bağlı olarak doğru model;
385
*
*
0 1 1
Y
Y X u e Y e
olacaktır. Model daha da düzenlenirse;
0 1 1
v
Y X u e
haline dönüşecektir. Açıkça anlaşılabileceği gibi bağımlı değişkende bir ölçme hatası
olduğunda bu durum sadece hata terimi etkilemektedir. Hata terimi e kadar büyümektedir.
Bağımlı değişkendeki bu ölçme hatası parametrelerin eğilimsizlik ve tutarlılık özelliklerini
etkilememektedir. Fakat hata teriminin varyansı olduğundan büyük tahmin edilmektedir. Bu
nedenle hesaplanan varyanslar etkin değildir.
-Bağımsız değişkende ölçme hataları:
Modelde yer alan bağımsız değişkenlerde herhangi bir sebeple ölçme hatası olduğunu
düşünelim. Ölçme hatası yapılan bağımsız değişken *X ile gösterilirse;
*X X e
*X X e
olmaktadır. Buna bağlı olarak model düzenlenirse;
*
0 1
0 1
0 1 1
0 1 1
0 1
( )
( )
v
Y X u
Y X e u
Y X e u
Y X u e
Y X v
haline dönüşmektedir. Açıkça görüldüğü gibi1 ’den dolayıhata terimleri ile bağımsız değişken
ilişkilidir.
( , ) 0KOV X u
Bu da EKK yönteminin önemli bir varsayımını çiğnemektedir. EKK tahmin edicileri
hem eğilimli hem de tutarsız olmaktadır.
386
Uygulamalar
387
Uygulama Soruları
1) Model spesifikasyonu ne demektir?
Modelin belirlenmiş olan matematiksel kalıbını ifade etmektedir.
2) Spesifikasyon hataları kaç şekilde karşımıza çıkmaktadır?
Modelin büyüklüğü ile ilgili hatalar
Modelin matematiksel kalıbı ile ilgili hatalar
3) Model spesifikasyonunun yanlış olduğunu ilk bakışta nasıl anlayabiliriz.
Eğer modelden önemli bir değişken dışlanmış ya da matematiksel kalıp yanlış belirlenmişse
kalıntıların grafiği gelişigüzel dağılmayacaktır yani belirli bir görüntü sergileyecektir.
4) Önemli bir değişkenin modelden dışlanmasının meydana getirdiği sonuçlar nelerdir?
EKK tahmin edicileri hem eğilimli hem de tutarsız olmaktadır.
5. Tahmin edilen aşağıdaki modelde X2 değişkeninin gerekli bir değişken olup olmadığını
araştırınız.
2
1 20.985 1.33 4.35 0.74
: ( 5.50) (1.33) ( 1.34)
Y X X R
t
388
0 2
1 2
(0.05;12)
0
: 0
: 0
1.34
2.179
:
hesap
hesap tablo
H
H
t
t
t t H kabul
Modele ilave edilmiş değişken istatistiksel olarak anlamsız çıktığından dolayı X2 değişkeninin
gereksiz bir değişken olduğu söylenebilmektedir.
6.Aşağıda matematiksel kalıpları birbirinden farklı olan 2 model oluşturulmuştur.
1) 0 1 1 2 2Y X X v
2) 2 2
0 1 1 2 2 3 1 4 2Y X X X X e
Modellerden elde dilen kalıntıların grafiği aşağıdaki gibi ise hangi modelin uygun model
olduğu söylenebilir.
1. Modelden elde edilen kalıntılar biribirleriyle ilişki halindedir ve otokorelasyon olduğuna
kanaat getirebilecektir fakat 2. Modelde kalıntılar gelişi güzel dağılmaktadır. Bundan dolayı 2.
Model uygun olacaktır.
7) Aşağıda belirtilmiş durumları dikkate alarak sırasıyla cevaplandırınız.
i. 0 1 1 2 2ˆ ˆ ˆY X X u şeklinde tahmin edilmesi gereken bir model gerekli bir
değişkeni dışlanarak 0 1 1ˆ ˆY X e şeklinde tahmin edilmiştir. Elde edilmiş kalıntıların X2
değişkenine göre sıralanmasından elde edilmiş Durbin-Watson değeri de 1.71 olarak
bulunmuştur. Buna göre modelde spesifikasyon hatası olup olmadığını araştırınız.
0
1
:
:
H Model doğru kurulmuştur
H Model yanlış kurulmuştur
389
1.64<1.71<2.36
0H hipotezinin reddedilememiştirdolayısıyla model kurma hatası söz konusu değildir.
ii. 2
112.25 1.81 20 0.75Y X n R
şeklinde tahmin edilmiş bir modelde spesifikasyon hatası olup olmadığını araştırmak amacıyla,
bu modelin Y değerlerinin grafiği incelenmiş ve modele Y değerlerinin karelerinin ilave
edilmesine karar verilmiştir.
2 2
1ˆ5.2 2.7 0.05 0.87Y X Y R
İlk modelde spesifikasyon hatası olup olmadığını araştırınız.
0
1
:
:
H Model doğru kurulmuştur
H Model yanlış kurulmuştur
2 2
(0.05,1,17)2
0.87 0.75 115.69 , : 4,95
1 0.87 20 31
yeni eski
yeni
R R mF F
R n k
iii. Bağımlı değişkende bir ölçme hatası olması durumunda sonuçlar nasıl
değişmektedir?
Bağımlı değişkende bir ölçme hatası olduğunda bu durum sadece hata terimi
etkilemektedir. Hata terimi e kadar büyümektedir. Bağımlı değişkendeki bu ölçme
hatası parametrelerin eğilimsizlik ve tutarlılık özelliklerini etkilememektedir. Fakat
hata teriminin varyansı olduğundan büyük tahmin edilmektedir. Bu nedenle
hesaplanan varyanslar etkin değildir.
390
iv. Bağımsız değişkende bir ölçme hatası olması durumunda sonuçlar nasıl
değişmektedir?
EKK tahmin edicileri hem eğilimli hem de tutarsız olmaktadır.
391
Bu Bölümde Ne Öğrendik Özeti
Model kurma hatalarından modelin fonksiyonel biçiminin yanlış belirlenmesi,
dışlanmış değişken, ilgisiz değişken, ölçe hatalarını ve sonuçlarının neler olduğunu öğrendik.
Modelin fonksiyonel biçiminin yanlış belirlenip belirlenmediğinin tespiti için izlenmesi
gereken aşamalar tespit edilmiş oldu.
392
Bölüm Soruları
1) Matematiksel kalıpları birbirinden farklı olan 2 model aşağıdaki gibi oluşturulmuştur.
i.0 1 1 2 2 3 1 2Y X X X X v
ii. 2 2
0 1 1 2 2 3 1 4 2Y X X X X e
Modellerden elde dilen kalıntıların grafiği aşağıdaki gibi ise hangi modelin uygun model
olduğu söylenebilir.
a) Her iki modelin de matematiksel kalıbı uygun değildir
b) 1. modelin matematiksel kalıbı uygundur
c) 2. modelin matematiksel kalıbı uygundur
d) Her iki modelin de matematiksel kalıbı uygundur
e) Karar verilemez
2) Aşağıdakilerden hangisi spesifikasyon hatalarından biri değildir?
a) Bağımsız değişkenlerdeki ölçme hataları
b) Modelin matematiksel biçiminin yanlış belirlenmesi
c) Dışlanmış değişken
d) Gereksiz değişken
e) Tahmin edilen parametrenin eğilimli olması
393
3) Aşağıdaki modeller arasında karar vermek için yapılacak Ramsey-Reset testinin F test
istatistiğini hesaplayınız.
2
1
2 3 2
1
166.467 19.93 10 0.84
ˆ ˆ2140.72 476.6 0.09 0.001 0.99
Y X n R
Y X Y Y R
a) 284,4
b) 384,4
c) 484,4
d) 584,4
e) 684,4
4) Aşağıda verilmiş olan model için
2
1 1
2
222.383 8.02 2.54 10
: (9.468) ( 0.818) (2.925) 0.92
Y X X n
t R
1X ve 2
1X değerleri yerine koyulup Y değerleri elde edilir. ˆ( )Y Y ’den de kalıntılar elde edilir.
Kalıntılar modelden dışlanmış olan 3
1X değişken değerlerine göre sıralanır. Sıralanmış olan
kalıntılar kullanılarak DW istatistiği hesaplanır.
3.67DW
Model kurma hatası var mıdır?
A) DW dL Model kurma hatası yoktur
B) dL DW dU Model kurma hatası yoktur
C) 4dU DW dU Model kurma hatası yoktur
D) 4 dU DW dL Model kurma hatası vardır
E) 4 4dL DW Model kurma hatası vardır
5)
Aşağıda verilmiş olan model için
2 3
1 1 1
2
21.383 8.02 2.54 1,25 35
: (9.468) ( 0.818) (2.925) (1.25) 0.872
Y X X X n
t R
394
1X , 2
1X ve 3
1X değerleri yerine koyulup Y değerleri elde edilir. ˆ( )Y Y ’den de kalıntılar elde
edilir. Kalıntılar modelden dışlanmış olan 4
1X değişken değerlerine göre sıralanır. Sıralanmış
olan kalıntılar kullanılarak DW istatistiği hesaplanır.
0,07DW
Model kurma hatası var mıdır?
A) DW dL Model kurma hatası vardır
B) dL DW dU Model kurma hatası vardır
C) 4dU DW dU Model kurma hatası vardır
D) 4 dU DW dL Model kurma hatası vardır
E) 4 4dL DW Model kurma hatası vardır
6) Aşağıda verilmiş olan model için modelin spesifikasyonunu test ediniz.
2
1
2 3 2
1
1.467 1.93 20 0.84
ˆ ˆ17.72 2.36 3.99 0.43 0.98
Y X n R
Y X Y Y R
A) F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model yanlış
kurulmuştur.
B) F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model yanlış
kurulmamıştır.
C) F istatistiği anlamsızdır. 0H hipotezi reddedildiğinden dolayı model yanlış
kurulmuştur.
D) F istatistiği anlamsızdır. 0H hipotezi reddedildiğinden dolayı model yanlış
kurulmuştur.
E) F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model doğru
kurulmuştur.
395
7) Aşağıda verilmiş olan model için Ramsey Reset testinin test istatistiğini bulunuz
2
1
2 3 2
1
1.467 1.93 20 0.84
ˆ ˆ17.72 2.36 3.99 0.43 0.98
Y X n R
Y X Y Y R
A) 7,90
B) 8,90
C) 10,90
D) 11,90
E) 12,90
8) Aşağıdaki gibi verilmiş olan 2 model içerisinden hangisi niçin seçilecektir?
0 1 1
2
0 1 1 2 1
1.model:
2.model:
Y X v
Y X X e
A) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.
B) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.
C) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.
D) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.
E) 2. Model seçilir, X bağımsız değişkeni 0 etrafında rastgele bir dağılım izlemektedir.
396
9) Aşağıda verilmiş olan model için
1
2
222.383 8.02 10
: (9.468) ( 0.818) 0.92
Y X n
t R
1X değerleri yerine koyulup Y değerleri elde edilir. ˆ( )Y Y ’den de kalıntılar elde edilir.
Kalıntılar modelden dışlanmış olan 2
1X değişken değerlerine göre sıralanır. Sıralanmış olan
kalıntılar kullanılarak DW istatistiği hesaplanır.
1.67DW
Model kurma hatası var mıdır?
A) DW dL Model kurma hatası yoktur
B) dL DW dU Model kurma hatası yoktur
C) 4dU DW dU Model kurma hatası yoktur
D) 4 dU DW dL Model kurma hatası vardır
E) 4 4dL DW Model kurma hatası vardır
10) Aşağıdaki gibi verilmiş olan 2 model içerisinden hangisi niçin seçilecektir?
2
0 1 1 2 1
2 3
0 1 1 2 1 3 1
1.model:
2.model:
Y X X v
Y X X X e
A) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.
B) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.
397
C) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.
D) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.
E) 2. Model seçilir, X bağımsız değişkeni 0 etrafında rastgele bir dağılım izlemektedir.
Cevaplar
1) c
2) e
3) a
4) e
5) a
6) a
7) a
8) c
9) c
10) c
398
KAYNAKÇA
Ahmet Kılıçbay, “Ekonometrinin Temelleri”. İ.Ü. İktisat Fakültesi, İstanbul, 1980.
Davidson,R., MacKinnon,J.G. “Econometric Theory and Methods”, Oxford Univesity
Press, 2003.
Davidson,R., MacKinnon,J.G. “Estimation and Inference in Econometrics”, Oxford
Univesity Press, 1993.
Ebru Çağlayan, Selahattin Güriş, “Ekonometri Temel Kavramlar”, Der Yayınları, 2010.
Gujarati, D.N., “Basic Econometrics”, Mcgraw-Hill, New York, 2004.
Gujarati, D.N., “Essentials of Econometrics”, Mcgraw-Hill, New York, 1992.
Greene, W.H., “Econometric Analysis, Fifth Edition”, Prentice Hall, New Jersey,2003.
Hill, R.C., Griffiths, W.E., Lim, G.C., “Principles of Econometrics, Third Edition”,
Wiley,USA, 2007.
Hill, R.C.,Griffiths, W.E., Judge, G.G., ”Undergraduate Econometrics, Second Edition”
John Wiley and Sons Ltd, England, 2002.
Maddala, G.S., “Introduction to Econometrics, Third Edition”, John Wiley and Sons
Ltd, England, 2001.
Mustafa Tekin, Ebru Çağlayan ” Excel ile Temel Ekonometri “, Der Yayınları, 2003
Selahattin Güriş, Ebru Çağlayan, Burak Güriş, “EViews ile Temel Ekonometri” Der
Yayınları, 2011.