EKONOMETRİ - İstanbul Üniversitesiauzefkitap.istanbul.edu.tr/kitap/kok/ekonometriu159.pdf · 2020. 4. 17. · I . ÖNSÖZ. Ekonometri dersi, iktisat teorilerinin, uygulamada geçerliliğinin

EKONOMETRİ

ORTAK DERS

PROF. DR. NİLGÜN ÇİL

İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ

İSTANBUL ÜNİVERSİTESİ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ

ORTAK DERS

EKONOMETRİ

Prof. Dr. Nilgün ÇİL

Yazar Notu

Elinizdeki bu eser, İstanbul Üniversitesi Açık ve Uzaktan Eğitim Fakültesi’nde okutulmak için

hazırlanmış bir ders notu niteliğindedir.

I

ÖNSÖZ

Ekonometri dersi, iktisat teorilerinin, uygulamada geçerliliğinin test edilmesi ve iktisat

politikaları için kullanılabilmesi amacıyla matematik, istatistik ve ekonometri bilimlerinin

araçlarından yararlanarak ölçülebilir somut modeller ortaya koymayı hedefler.

Ekonometri dersi, bu amacına ulaşmak için, iktisadi analiz için matematiksel,

istatistiksel ve ekonometrik teknik ve modellerden nasıl yararlanacağını analiz eder. Daha ileri

konularda ise ileri iktisat teorilerinin matematiksel istatistik ve ekonometri modellere

dönüştürülmesi ve bu teorilerin ampirik geçerliliğini test ederek iktisat teorisinin gelişimine

katkı sağlar, diğer yandan, istatistik ve ekonometrik araçlar kullanarak da iktisat politikalarında

karar vermede önemli bir araç özelliği görevi üstlenir.

II

İÇİNDEKİLER

ÖNSÖZ ........................................................................................................................................ I

İÇİNDEKİLER .......................................................................................................................... II

KISALTMALAR .................................................................................................................... VII

YAZAR NOTU ..................................................................................................................... VIII

1. EKONOMETRİYE GİRİŞ ..................................................................................................... 1

1.1. Ekonometri Nedir? Ekonometrinin Gerekliliği ............................................................... 7

1.2. Ekonometrinin Amacı ve Yöntemi ................................................................................. 8

1.3. Ekonometrik Model ....................................................................................................... 12

1.4. İktisadi Veri Türleri ....................................................................................................... 13

1.4.1. Zaman Serisi Verisi .......................................................................................... 14

1.4.2. Yatay Kesit Verisi ............................................................................................ 15

1.4.3. Panel Veri ......................................................................................................... 16

1.5. İktisadi Veri Kaynakları ................................................................................................ 17

1.6. Ekonometride Bilgisayarın ve Paket Programların Yeri ............................................... 17

2. REGRESYON ANALİZİNE GİRİŞ .................................................................................... 27

2.1. Regresyon Analizine Giriş ............................................................................................ 33

2.2. Regresyon ve Korelasyon .............................................................................................. 35

2.3. Ana kütle Regresyon Modeli ......................................................................................... 36

3. BASİT DOĞRUSAL REGRESYON MODELİ .................................................................. 63

3.1. Regresyon Parametrelerinin Tahmini ............................................................................ 69

3.2. En Küçük Kareler Yaklaşımı ........................................................................................ 69

3.2.1. Basit Regresyon Modelinin Tahmini İçin En Küçük Kareler Yöntemi ........... 69

3.2.2. En Küçük Kareler Yönteminin Sapmalar Kuralı ile Uygulaması .................. 72

3.3. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları ............................................ 75

III

4. EN KÜÇÜK KARELER TAHMİNCİLERİNİNDEĞERLENDİRİLMESİ ...................... 100

4.1. En Küçük Kareler Tahmincilerinin Değerlendirilmesi ............................................... 106

4.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları ............................... 106

4.3. Hata Terimi Varyansının Tahmini ........................................................................... 109

4.4. Uygulama: Satış Gelirleri İle Reklam Harcamaları ................................................. 110

4.5. Esneklikler ................................................................................................................... 111

4.6. Uygulama: Satış Gelirleri İle Reklam Harcamaları .................................................... 112

5. ARALIK TAHMİNİ VE HİPOTEZ TESTİ ....................................................................... 123

5.1. Aralık Tahmini ............................................................................................................ 129

5.1.1. Normal Dağılım ve t-Dağılımı ....................................................................... 129

5.1.2 Aralık Tahminlerini Elde Etme ....................................................................... 131

5.1.3. Açıklayıcı Uygulama: Satış Modeli ............................................................... 132

5.2 Hipotez Testleri ........................................................................................................... 133

5.2.1 Temel Hipotez ................................................................................................. 134

5.2.2 Alternatif Hipotez ........................................................................................... 134

5.2.3 Test İstatistiği .................................................................................................. 134

5.2.4. Red Bölgesi .................................................................................................... 135

5.2.5. Karar .............................................................................................................. 135

6. UYUMUN İYİLİĞİ ........................................................................................................... 147

6.1. Uyumun İyiliğinin Ölçülmesi ve Önemi ..................................................................... 153

6.2. Belirginlik katsayısı ..................................................................................................... 153

6.3. Tahmini Standart Hatası .............................................................................................. 158

6.4. Genelleştirilmiş 2r ...................................................................................................... 159

6.5. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları .......................................... 160

IV

7. UYUMUN İYİLİĞİ VE MODELLEME KONULARI ..................................................... 176

7.1. Orijinden Geçen Regresyon ........................................................................................ 182

7.2. Fonksiyonel Biçimin Belirlenmesi .............................................................................. 183

7.2.1. Log-Log Model (Tam Logaritmik Model) .................................................... 185

7.2.2. Log-Doğrusal Model ..................................................................................... 189

7.2.3. Doğrusal-log Model ....................................................................................... 191

7.3. Hata Terimleri için Normal Dağılımın Testi: Jarque-Bera Testi ............................... 194

8. ÇOK DEĞİŞKENLİ REGRESYON MODELİ ................................................................. 207

8.1. Çok Değişkenli Regresyon Modeli ............................................................................. 213

8.2. Çok Değişkenli Regresyon Modelinin Varsayımları .................................................. 215

8.3. Çoklu Değişkenli Regresyon Modeli Parametrelerinin Tahmini: En Küçük Kareler

Yöntemi .............................................................................................................................. 217

8.4. Açıklayıcı Örnekler : İthalat Modeli ........................................................................... 219

8.5. Hata Terimi Varyansının ( 𝛔𝟐 )Tahmini ..................................................................... 222

8.6. Açıklayıcı Örnek: İthalat Modeli ................................................................................ 223

9. Çok Değişkenli Regresyon MOdeliNde AraLIK TAHMİNİ VE HİPOTEZ TESTİ ......... 236

9.1. En Küçük Kareler Tahmincilerinin Örnekleme Özellikleri ........................................ 242

9.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları .................................. 242

9.3. En Küçük Kareler Tahmincilerinin Dağılımı .............................................................. 245

9.3.1. Aralık Tahmini ............................................................................................... 246

9.3.2. Hipotez Testi .................................................................................................. 247

9.4. Uyum İyiliğinin Ölçülmesi: Belirginlik Katsayısı ...................................................... 248

10. ÇOK DEĞİŞKENLİ REGRESYON MODELİNDE İLERİ ÇIKARSAMA ................... 260

10.1. Birleşik Hipotezlerin Testi .................................................................................. 266

10.2. F-testi ................................................................................................................... 266

V

10.3. Modelin Anlamlılığının Testi .............................................................................. 269

10.3. F- ve t- Testleri Arasındaki İlişki ............................................................................. 271

10.4. Varyans Analiz (ANOVA) Tablosu ......................................................................... 272

11. OTOKORELASYON ....................................................................................................... 286

11.1. Otokorelasyon Nedir?................................................................................................ 292

11.2. En Küçük Kareler Tahmincileri İçin Otokorelasyonun Sonuçları ............................ 293

11.3. Otokorelasyonun Tespit Edilmesi ............................................................................. 293

11.3.1. Sistematik Olmayan Test: Kalıntı Grafikleri ............................................... 293

11.3.2. Sistematik Testler ......................................................................................... 294

11.3.3. Otokorelasyonun Varlığı Durumunda Parametre Tahmin Yöntemleri ........ 303

12. DEĞİŞEN VARYANS (HETEROSKEDASİTE) ........................................................... 314

12.1. Değişen Varyansın Yapısı ......................................................................................... 320

12.2. En Küçük Kareler Tahmincileri İçin Değişen Varyansın Sonuçları ......................... 324

12.3. Değişen Varyansın Tespit Edilmesi .......................................................................... 325

12.3.1. Sistematik olmayan test: Kalıntı Grafikleri ................................................. 326

12.3.2. Sistematik Testler ......................................................................................... 326

12.4. Değişen Varyansın Varlığı Durumunda Parametre Tahmin Yöntemleri .................. 339

13. ÇOKLU DOĞRUSAL BAĞLANTI ................................................................................ 351

13.1. Çoklu Doğrusal Bağlantının Sebepleri ...................................................................... 358

13.2. Çoklu Doğrusal Bağlantının Dereceleri .................................................................... 358

13.3. Çoklu Doğrusal Bağlantının Sonuçları ..................................................................... 360

13.4. Çoklu Doğrusal Bağlantının Tespiti .......................................................................... 360

14. SPESİFİKASYON HATALARI ...................................................................................... 371

14.1. Modelin Büyüklüğü İle İlgili Hatalar ........................................................................ 377

14.2. Modelin Matematiksel Kalıbı İle İlgili Hatalar ......................................................... 379

VI

14.3. Ölçme Hataları .......................................................................................................... 384

KAYNAKÇA ......................................................................................................................... 398

VII

KISALTMALAR

Kısaltma yoktur.

VIII

YAZAR NOTU

Önsöz’de detaylı açıklandığı gibi, Ekonometri dersi, iktisat teorilerinin, uygulamada

geçerliliğinin test edilmesi ve iktisat politikaları için kullanılabilmesi amacıyla matematik,

istatistik ve ekonometri bilimlerinin araçlarından yararlanarak ölçülebilir somut modeller

ortaya koymayı hedefler. Ancak ders, açık ve uzaktan eğitim ihtiyaçlarına yönelik olarak en

temel düzeydeki konuları sade bir dille açıklayıp öğretmeyi hedeflemek için tasarlanmıştır.

Öğrencilerin ekonometriyi anlayıp sindirebilmeleri için her bir konuyu anladıklarına ve

sorularını çözebildiklerine emin olduktan sonra bir sonraki konuya geçmeleri daha sağlıklı

ilerlemeleri için önemlidir. Kitabın öğrencilere yararlı olması dilerim.

1

1. EKONOMETRİYE GİRİŞ

2

Bu Bölümde Neler Öğreneceğiz?

1.1. Ekonometri Nedir? Ekonometrinin Gerekliliği

1.2. Ekonometrinin Amacı ve Yöntemi

1.3. Ekonometrik Model

1.4. İktisadi Veri Türleri

1.4.1. Zaman Serisi Verisi

1.4.2. Yatay Kesit Verisi

1.4.3. Panel Veri

1.5. İktisadi Veri Kaynakları

1.6. Ekonometride Bilgisayarın ve Paket Programların Yeri

3

Bölüm Hakkında İlgi Oluşturan Sorular

1) Ekonometri nedir?

2) Ekonometrinin iktisat bilimi ile ilişkisi nedir?

3) Ekonometriyi öğrenmenin iktisat öğrencisine sağlayacağı katkı ne olacaktır?

4

Bölümde Hedeflenen Kazanımlar ve Kazanım Yöntemleri

Konu Kazanım Kazanımın nasıl elde

edileceği veya geliştirileceği

Ekonometri Kavramı Ekonometrinin önemi ve

işlevini detaylı olarak ortaya

koyabilmek.

Ders notları

Ekonometrinin bileşenleri Ekonometrinin iktisat,

matematik ve istatistikten

ilişkisi açıklayabilmek

Ders notları

Ekonometrinin metodolojisi Ekonometrik çalışmanın

aşamalarını anlamış olmak

Ders notları

Veri Ekonometrik çalışmada

kullanılan İktisadi veri

türlerini ve özelliklerini

açıklamak

Ders notları

5

Anahtar Kavramlar

Ekonometri

Matematiksel Model

Ekonometrik Model

Bağımlı Değişken

Bağımsız Değişken

Hata Terimi

Gözlemlenmiş (Geriye Dönük) Veri

Frekans (Veri Sıklığı)

Zaman Serisi Verisi

Yatay Kesit Verisi

Panel Veri

6

Giriş

Bu bölümde iktisat öğrencilerinin “Niçin Ekonometri Öğreniriz?” sorusuna cevap

arayacak, iktisatçıların eğitiminde özel bir role sahip olan ekonometrinin önemi, metodolojisi

ve uygulama alanı üzerinde duracağız. Siz iktisat öğrencileri iktisat eğitiminin ilk yıllarında

İktisada Giriş, Makro İktisat ve Mikro İktisat derslerinde arz ve talep, çarpan katsayısı, marjinal

maliyet, ortalama maliyet, fırsat maliyeti, kıt kaynaklar ve karşılaştırmalı üstünlük gibi

kavramları öğreniyor, para politikası ve maliye politikasının işleyişini ve piyasalar üzerindeki

etkilerini, hükümet politikalarının piyasayı nasıl etkilediğini öğreniyorsunuz. Kısaca bir iktisat

öğrencisi olarak, “bir iktisatçı gibi düşünmeyi” öğreniyorsunuz. Bu bağlamda iktisat eğitimi,

İktisat Fakültesi mezunu bir öğrenciye mezuniyet sonrası gerek kamu gerekse özel sektörde

geniş bir iş yelpazesi sunar.

Mezuniyet sonrası iş dünyasına girmek isteyen İktisat Fakültesi mezunundan, işveren

“Şirketimiz için ne yapabilirsiniz?” sorusuna cevap almak isteyecektir. İktisat eğitimi alan

birinin “ Bir iktisatçı gibi düşünebilirim” cevabı, işvereni tatmin edecek yeterli bir cevap

olmayabilecektir. Bir iktisat öğrencisinin lisans eğitiminde öğrenmiş olduğu bilgi ile

iktisatçıların gerçekte ne yaptığı arasında farklılık vardır. Özel sektörde veya kamu sektöründe

çalışan iktisat mezunları genellikle uygulamalı iktisadi analiz ile ilgilenirler. Uygulamalı

iktisadi analizden kasıt, iktisadi verileri kullanarak iktisadi ilişkileri tahmin etmek, iktisadi

hipotezleri test etmek ve iktisadi gelişmeleri öngörmektir.

Ekonometriyi öğrenmek, iktisat öğrencisi olmak ile uygulamalı iktisatçı olma arasındaki

arasındaki farkı kapatır. Ekonometri eğitimi alan ve ekonometriyi kullanabilen bir iktisat

Fakültesi mezunu, işverenin yukarıdaki sorusuna “ Ürününüzün satış öngörüsünü yapabilirim”,

“Rakiplerinizin ürün fiyatını 1 lira düşürdüğünde, satışlarınız üzerindeki etkileri tahmin

edebilirim”, “Reklam harcamalarınızın satışlarınızı gerçekten arttırıp arttırmadığını test

edebilirim” gibi detaylı cevap verebilecektir. Bu cevaplar hem bir iktisatçı gibi

düşünebildiğinizi hem de iktisadi verileri kullanabilme yeteneğine sahip olduğunuzu yansıttığı

için, şüphesiz işvereni daha memnun edici cevaplardır. Dolayısıyla ekonometri, iş

başvurusunda bulanan iktisat mezununa işe girmede önemli bir avantaj sağlayacaktır.

İktisadi ölçüm için temel olan ekonometri ve ekonometrinin önemi İktisat Biliminin

ötesine yayılmıştır. Ekonometrik yöntemler günümüzde muhasebe, finans, pazarlama, yönetim

gibi işletme disiplinlerinde, sosyoloji, psikoloji

7

1.1. Ekonometri Nedir? Ekonometrinin Gerekliliği

İktisat ilminin dayandığı iktisat teorisi, iktisadi değişkenler arasındaki ilişkilerin

özelliklerini ve iktisadi olayları açıklamaktadır. En iyi teori, şüphesiz bütün değişkenleri ve bu

değişkenler arasındaki bağlantıları eksiksiz olarak ele alan ve ekonominin işleyişini bir zaman

dilimi içinde (statik) veya zaman akımı çerçevesinde (dinamik) gösterebilen teoridir. Bu

bağlamda iktisat teorisi değişkenler arasındaki ilişkilerin genel eğilimi ve değişkenler arsındaki

sebep sonuç bağlantısı hakkında bilgi verir. Ancak iktisat teorisi genel olarak varsayımlar ve

hipotezlere dayanmakta olup, ampirik bir çalışmadan yoksundur. İktisat teorisi ile gerçekler her

zaman birebir örtüşmezler hatta önemli çelişkiler olabilir.

Ekonometri, iktisadi ilişkileri tahmin etmek, iktisadi teorileri test etmek, devlet veya

işletme politikalarını değerlendirmek ve uygulamak için istatistiksel yöntemlerin kullanımına

dayanmaktadır.

Ekonometrinin bu tanımına göre, ekonometrik bir çalışmanın temelinde iktisat teorisi

vardır. Ekonometri; matematik ve istatistik disiplinlerinden faydalanarak, iktisat teorisinin

belirlediği ilişkiler ile ilgili sayısal sonuçlara ulaşır, varılan sonuçların analizini yapar, teori ile

sayısal verilere göre belirlenen gerçekler arasındaki uygunluk ve çelişkileri analiz ederek

varılan sonuçların güvenilirliğini test eder. Böylece ekonometri, eğilimler yerine sayısal

değerler verdiği için, teorinin belirlediği iktisadi realitenin kıyaslanmasını sağlar. Kısaca

ekonometri, iktisadi ölçüm anlamına gelmektedir.

Şekil-1.1: Ekonometri biliminin diğer bilim dallarıyla ilişkisi

İktisat teorisi, matematik ve istatistiğin bir bileşimi olan ekonometri, bu üç bilim dalının

her birinden bütünüyle farklıdır. İktisat teorisi, matematik ve istatistik ile bunların bileşimleri

iktisadi istatistikler, matematiksel istatistik ve matematiksel iktisat günümüz iktisadi

olaylardaki nicel ilişkilerin kavranması için gerekli olmakla birlikte hiçbiri tek başına yeterli

değildir.

8

Ekonometri; kuramsal iktisat, matematiksel iktisat ve iktisadi istatistikten ayrı bir bilim

dalıdır. Çünkü;

• İktisat teorisi genellikle önsavlar (hipotezler) öne sürer. İktisat teorisi iki veya daha

fazla değişken arasındaki ilişkinin yönüne odaklanırken, ilişkinin sayısal ölçümünü vermekten

uzaktır. Ekonometri ise, iktisat kuramına ampirik bir içerik katar.

• Matematiksel iktisadın görevi iktisat kuramını matematiksel kalıplar içerisine

sokmaktır. Matematiksel eşitliklerin ekonometrik eşitlikler haline sokulması ve doğrulanması

ise ekonometrinin konusudur.

• İktisadi istatistiğin ilgi alanı iktisadi verileri derlemek ve işlemektir. Toplanan bu

verilerin kullanılarak iktisat teorilerinin doğrulanması sayısal kestirimlerin yapılması ise

ekonometrinin konusudur.

Bu bağlamda ekonometri iktisat teorisinin belirlediği iktisadi ilişkileri en uygun, en

gerçekçi, işlenebilir matematiksel bir model içinde ele alarak, değişkenler arasındaki

bağlantıyı kuran parametrelerin sayısal değerlerini en doğru tahmin edecek yöntemleri araştırır.

Ekonometri, “ne kadar” sorularına cevap vermek için, istatistik yöntemler ile birlikte,

iktisat, işletme ve diğer sosyal bilimlerdeki teori ve verileri nasıl kullanacağımız ile ilgilidir.

Genel olarak ekonometri, iktisadi verileri ve aralarındaki ilişkileri analiz etmek için

iktisat teorisi ve istatistik yöntemleri kullanma bilimi ve sanatıdır. Makro iktisat, mikro iktisat,

çalışma ekonomisi, finans, pazarlama ve iktisat politikası dahil olmak üzere ekonominin birçok

bilim dalında ekonometrik yöntemler yoğun olarak kullanılmaktadır.

1.2. Ekonometrinin Amacı ve Yöntemi

Ekonometrinin amacı iktisat teorisinin belirlediği iktisadi ilişkileri kantitatif bir model

çerçevesinde ele alarak değişkenlerin değişme sebeplerini sayısal ölçülerle ifade etmek ve bu

değişkenlerin gelecekte alabilecekleri değerleri tahmin edebilmek ve iktisat teorilerinin

doğruluğunu test etmektir.

Genel olarak ekonometri, teorik ekonometri ve uygulamalı ekonometri olarak ikiye

ayrılır. Gerek teorik ekonometriye gerekse uygulamalı ekonometriye Klasik ya da Bayesgil

geleneklerle yaklaşılabilinir. Ancak ekonometriye giriş düzeyindeki kitaplarda genellikle klasik

yaklaşım tercih edilmekte, Bayesgil yaklaşım kullanılmamaktadır. Bu derste de klasik yaklaşım

kullanılacaktır.

Teorik ekonometri ile uygulamalı ekonometrinin birbirinden tamamen ayrılmış olan

alanlarını belirlemek ve iki disiplinin kesin sınırlarını çizmek zordur. Teorik ekonometri, bir

yandan en uygun ekonometrik modellerin geliştirilmesi sorununu incelerken, diğer yandan

ekonometrik modeller için en uygun parametre tahmin yöntemlerini inceler. Uygulamalı

ekonometri ise, gerçek verilere dayanarak ilgili iktisadi olay için en uygun kabul edilen

9

ekonometrik modelin parametrelerini en iyi biçimde tahmin edip, bunun sonuçlarını incelemek

gibi konularla ilgilenir.

Teorik ekonometri, genel iktisat teorisi ile en ileri iktisat teorisi prensiplerinden

başlayarak, model yapımı, matematiksel modeller bilgisinin ışığında ekonometrik modellerin

yapımı için gerekli teorik bilgiyi verir. Ayrıca teorik ekonometri, modellere uyan parametre

tahmini için gerekli yöntemleri gösterir ve en uygun modelin en iyi parametre tahmini yollarını

ayrıntılı olarak araştırır. Uygulamalı ekonometri ise kantitatif araştırma alanı ve konusu ile ilgili

en uygun modelin seçimini yapar, modelin parametre tahminine elverişlilik ve yeterlilik

şartlarını araştırır, en uygun parametre tahmin yöntemlerini seçer. Kısaca uygulamalı

ekonometri, araştırma konusu olan alanın seçilmesinden, gerekli verilerin toplanıp, işlenip

rafine hale getirilmesinden, en uygun ekonometrik modelin belirlenip en iyi parametre tahmin

yönteminin seçilip uygulamasından tahmin ve testlere kadar uzanan halkalarda oluşan bir

zincirdir.Ekonomik modellerin ekonometrik analizinde gerekli adımlar aşağıdaki şemada

verilmiştir.

Ekonometrik modelin başarısı öncelikle iktisat teorisinin iyi anlaşılmasına bağlıdır.

Ekonometrik araştırmanın dayandığı iktisat teorisinin unsurları iktisadi değişkenler arasındaki

ilişkilerin doğru tespit edilmesi gerekmektedir. Aksi takdirde temeli olmayan bir binanın inşa

edilmesi söz konusu olup, temeli olmayan binanın çökeceği gibi, teoriden yoksun ekonometrik

modelin tahmini de gerçeği yansıtmaktan uzak olacaktır.

İktisat teorisinin ilişkileri önce matematik terimleri ile ifade edilir, diğer bir ifade ile

matematiksel model kurulur. Matematiksel model çeşitli iktisadi ilişkileri tanımlamaktadır.

Matematiksel modelden ekonometrik modele geçilir. Ekonometrik modelin en önemli özelliği

rassal bir öğe (hata terimi) içermesidir. (daha sonra matematiksel model ile ekonometrik

modelin farklılığı açıklanacaktır.) Modelde yer alan değişkenlere ait ölçümler yapılarak,

modelin tahmini için gerekli olan veriler elde edilir. Daha sonraki aşamada iktisadi ilişkilerin

katsayılarının sayısal değerlerini bulmak için ekonometrik tahmin yöntemleri kullanılır.

Aşağıda verdiğimiz şemayı bir örnekle şu şekilde açıklayabiliriz. İktisat teorisi bir

kişinin tüketiminin, harcanabilir gelirine, servetine, zevk ve alışkanlıklarına bağlı olduğunu

öngörür. Bu kesin bir ilişkiyi ifade etmektedir. Çünkü tüketimin bütünüyle bu üç etmen

tarafından belirlendiği, bunların dışında hiçbir etmenin tüketimi etkilemediği sonucu ortaya

çıkmaktadır.

10

Şekil-1.2: Ekonometrik analizin adımları

11

Ct f (Yht ,Wt ,t)

Burada,

Ct = Tüketimi

Yht = Harcanabilir geliri

Wt = Serveti

t =Zevk ve alışkanlıkları gösteren trend değişkenini ifade etmektedir.

Matematiksel iktisatta tüketimin yukarıdaki soyut iktisadi ilişkisi matematik terimleri

ile ifade edilir ve aşağıdaki tüketim denklemi yazılabilir.

Ct 0 1Yht 2Wt 3t

Burada 0 , 1, 2 ve 3 ise matematiksel modelin katsayılarıdır. Bu matematiksel model

kesin ilişkileri göstermektedir, çünkü tüketim sadece eşitliğin sağ tarafındaki iktisadi

değişkenler tarafından açıklanmaktadır. Ancak iktisadi gerçekler göstermektedir ki, tüketimi

iktisadi krizler, vergi düzenlemeleri gibi başka iktisadi unsurlar da etkileyebilmektedir. Ayrıca

insan davranışı, psikolojik ve toplumsal etmenlerin etkisi altındadır ve düzenli değildir.

Dolayısıyla tüketim modeli sıraladığımız değişkenlerin de etkisi altında olduğuna göre

matematiksel modeldeki kesinlikten uzaklaşacaktır. Model dışındaki bu etmenler dikkate

alındığında model aşağıdaki gibi rastlantısal (stokastik) biçimi alır ve ekonometrik model

olarak adlandırılır.

Ct 0 1Yht 2Wt 3t ut

Yukarıdaki denklemde yer alan u, hata terimi adını alır. Ekonometrik modelin,

matematiksel modelden farkı bünyesinde hata terimini barındırması ve dolayısıyla kesin

ilişkileri değil, rastlantısal ilişkileri ifade etmesidir.

Bundan sonraki adım ekonometrik modelde yer alan değişkenlere ilişkin gerçek

verilerin sağlanmasıdır. Daha sonra model ekonometrinin kendine özgü yöntemleri ile tahmin

edilir ve parametre olarak adlandırılan modelin katsayılarının sayısal değerleri elde edilir.

Modelin tahmininden sonraki aşama, modelin geçerliliğinin test edilmesidir. Tahmin

edilen modelin sonuçlarının öncelikle iktisat teorisi ile uyumlu olması gerekmektedir. Şöyle ki;

tüketim modelinde harcanabilir gelirin katsayısı ( 1 ) tanım gereği (ileride tekrar üzerinde

durulacaktır) marjinal tüketim meyline eşittir. Marjinal tüketim meyli ise 0 ile 1 değerleri

arasında yer almaktadır. Eğer model tahmini sonucunda 1, bu sınırlar dışında ise tahmin

sonuçları iktisadi açıdan kabul edilemez, bu durumda model ilk aşamadan itibaren yeniden ele

alınmalı ve hatanın kaynağı araştırılmalıdır.

12

. Modelin geçerliliğinin testinden diğer bir kasıt, modelin ekonometrik açıdan temel

varsayımlara uygunluğudur.

Test sonuçlarına göre uygun model herhangi bir hipotezin testinde, iktisat politikası

modelinin oluşumunda ve geleceğin tahmininde kullanılabilir.

Yukarıda da görüldüğü üzere, matematiksel terimlerle ifade edilen, genel iktisat

teorisiyle iktisadi gerçeklerin nicel ölçümünün birleştirildiği, kendine özgü tahmin yöntemleri

olan ekonometrinin üç temel amacı vardır. Bunlar:

1. İktisat teorilerinin doğruluğunun sınanması,

2. İktisadi ilişkilerin katsayıları için sağlanan sayısal tahminleri, iktisat politikası

yapımında kullanmak,

3. Parametrelerin sayısal tahminlerinden iktisadi değişkenlerin gelecekteki değerlerini

tahmin etmektir. Faiz oranları, enflasyon oranları, GSYİH gibi makro iktisadi değişkenlerin

ileriye yönelik tahminleri ekonometrinin en yaygın uygulamalarındadır.

Ekonometrinin amacı iktisadi olayları ve iktisadi değişkenler arasındaki ilişkileri

kantitatif bir model içinde ele alarak değişkenlerin değişme sebeplerini sayısal ölçülerle ifade

etmek ve bu değişkenlerin gelecekte alabilecekleri değerleri tahmin edebilmektir. Buna göre

ekonometri biliminin nihai hedefi iktisadi olayların kantitatif ölçülerle izahını yapabilmek ve

geleceğin yine kantitatif olarak tahminini yapabilmektir.

1.3. Ekonometrik Model

Ekonometrik modellerin en önemli özelliği rastlantısal bir değişken olan hata terimi

içermesidir. İktisat teorisi ve matematiksel iktisat, iktisadi değişkenler arasında kesin ilişkiler

kurar. Ekonometri, iktisadi ilişkilerin kesin olduğunu kabul etmez ve bu ilişkilerin rassal

bileşeni ile ilgilenir. Aşağıda matematiksel bir model verilmiştir.

Y X

Burada yer alan α ve β modelin katsayılarıdır. Matematiksel modelde X değişkeninin

sabit bir değerine karşın Y değişkeni belli bir değer alır. Örneğin;

2 0.5Y X

matematiksel modelinde X değişkeni 1’e eşit ise, Y değişkeni 2.5 değerini alacaktır, başka bir

değer alması beklenmez. Ancak ekonometrik model kesin olmayan ilişkileri gösterdiğinden X

değişkeni sabit bir değere eşit iken, Y farklı değerler alabilir. Ekonometrik model aşağıdaki

gibidir.

i i iY X u

13

Ekonometrik modelde, modelin sağ tarafındaki değişken genel olarak bağımsız

değişken, sol tarafındaki değişken ise bağımlı değişken olarak adlandırılır. Ancak aşağıda

gösterildiği üzere farklı biçimlerde de adlandırılmaktadır.

Tablo-1.1: Bağımlı ve bağımsız değişken kavramları

Hata terimi, çeşitli iktisadi büyüklükler arasında kesin ilişkiler öngören iktisat teorisi ve

matematiksel iktisat tarafından göz ardı edilir. Ekonometride ise iktisadi ilişkilerin rassal

bileşenleriyle ilgili varsayımlarda bulunulmuş ve yeni yöntemler geliştirilmiştir.

1.4. İktisadi Veri Türleri

Veriler, iktisadi olaylar ve ilişkiler hakkında bilgi veren ve sayılarla ifade edilebilen

bilgi (enformasyon) kaynaklarıdır. Ekonometrik modeli tahmin edebilmek için verilere ihtiyaç

vardır ve ekonometrik modelin başarısı uygun ve güvenilir verilerin bulunmasına bağlıdır.

İktisatçılar ve sosyal bilimcilerin ilgilendiği ve ekonometrik modellerde yer alan

değişkenlere ait veriler Gözlenen veriler veya geriye dönük veriler olarak da adlandırılmaktadır.

Ekonometrik modellerde kullanılan verilerin bir örneği anket verileridir. Anketler kişilere

doğrudan, telefonla veya posta yolu ile gerçekleştirilmektedir. Ankete katılacak kişiler rassal

olarak seçilir ve anket sorularının cevapları kaydedilir. Böyle bir araştırmada, değişkenlere

yönelik veriler eşanlı olarak toplanmış olup, toplanan değerler ne sabittir ne de

tekrarlanabilirdir. GSYİH, faiz oranı, üretim miktarı, borsa endeksi, üretimin gerçekleşmesi için

kullanılan emek ve sermaye iktisadi verilere örnek olarak verilebilir.

Bir teoriyi test etmek veya bir ilişkiyi tahmin etmek amacıyla oluşturulan ekonometrik

model için gerekli olan veriler çeşitli kaynaklardan elde edilir.

Veriler çeşitli düzeyde toplulaştırmalardan elde edilebilir,

Bireyler, hane halkları ve firmalar gibi iktisadi karar vericiler üzerine mikro-veriler

toplanabilir.

Yerel, bölgesel veya ulusal düzeylerde, bireyler, hane halkları ve firmalar üzerine

havuzlama veya toplulaştırma ile makro-veriler toplanabilir.

Veriler ayrıca bir akım veya stok durumunu temsil edebilir:

Y X

Bağımlı değişken Bağımsız değişken

Açıklanan değişken Açıklayıcı değişken

İçsel (Endogen) değişken Dışsal (Egzogen) değişken

Öngörülen değişken Öngören değişken

Tepki değişkeni Kontrol değişkeni

14

Akım-veriler, 2010’un son çeyreği boyunca benzin tüketimi, bir işletmenin 2013

daki üretimi gibi bir zaman dönemi süresince ölçümü gösterir.

Stok-veriler, 1 Ocak 2014’da Merkez Bankası döviz rezervi veya BIST 100’de

işlem gören Garanti Bankasının 1 Mart 20014’deki varlık değeri gibi zamanın belirli bir

noktasındaki değerlerin ölçümünü gösterir.

Veriler niceliksel veya niteliksel olabilir:

Niceliksel veriler, reel fiyatlar veya kişi başına gelir gibi, sayılar veya bunların

kısmen dönüştürülmesi ile ifade edilebilen gelir veya fiyatlar gibi verilerdir.

Niteliksel veriler, ya öyle-ya böyle durumlarını gösterir. Örneğin, bir tüketici belirli

bir malı ya satın alır ya satın almaz veya bir kişi ya evlidir ya da değildir.

Ekonometrik modelin tahmini için kullanılan çeşitli veri setleri mevcuttur. Uygulamalı

çalışmalarda kullanılan en önemli iktisadi veri setleri aşağıdaki gibidir:

1.4.1. Zaman Serisi Verisi

Zaman serisi verileri bir veya birkaç değişkenin dönemler itibariyle gözlenen değerler

takımıdır. Bu tür veriler nicel veya nitel olabilmektedir. 2010 Ocak ayı için BİST-100 endeksi

günlük kapanış fiyatları, 2000-2010 yılları arası Akbank hisse senedine ilişkin yıllık getiri

rakamları, üçer aylık GSMH rakamlarının her biri zaman serisi verisine örnek teşkil etmektedir.

Örneklerden de anlaşılacağı üzere, zaman serisi verileri yıllık, 6 aylık, 3 aylık, günlük v.b.

frekanslarla oluşturulabilmektedir. Frekans veri toplanırken kullanılan veri sıklığıdır. İktisatta

en yaygın kullanılan frekanslar günlük, aylık, üçer aylık ve yıllıktır.

İktisadi zaman serisi verilerinin temel özelliklerinden biri kendi yakın tarihleri ile

kuvvetli ilişkili olduğudur. Bu durum iktisadi değişkenlerin bir trende (trend, genel eğilim

anlamına gelmektedir.) sahip olduğunu göstermektedir. Örneğin GSYİH zaman içinde artan bir

trende sahiptir. İktisadi zaman serilerinin diğer bir özelliği mevsimsel özellik taşıyabilmesidir.

Haftalık, aylık ve üçer aylık zaman serileri genellikle mevsimsel özelliklere sahiptir. Örneğin

üçer aylık GSYİH, turizm gelirleri değişkenlerine ilişkin zaman serisi verileri mevsimsel

özellikler taşımaktadır.

15

Genel olarak zaman serisi verisi, ekonometrik modelde yer alan değişkenlerin zaman

boyutu çerçevesindeki değişmelerinin sayısal ifadesidir. Zaman serisi verilerinin ekonometrik

modelde gösterimi ile ilgili aşağıdaki basit model açıklayıcı olacaktır.

0 1t tC Y ,

Bu modelde yer alan

tC = t zamanındaki tüketimi,

tY = t zamanındaki geliri

ifade etmektedir. 0 ve 1 ise modelin parametreleridir. t zaman dizisi, verileri alınacak

tüketim (C ) ve gelir (Y) değişkenlerinin t=1,2,…,T örnekleme dönemi için sayısal

değerlerdir.

1.4.2. Yatay Kesit Verisi

Yatay kesit verileri, belli bir zaman noktasında derlenen verilerden oluşmaktadır. Yatay

kesit verileri bireyler, hane halkları, firmalar, ülkeler, iller gibi farklı iktisadi birimler hakkında,

birimlerin aldığı belli bir zaman noktasında aldığı değerler açısından bilgi verir. Örneğin;

BİST’de işlem gören hisse senetlerinin 6 Temmuz 2017 tarihindeki kapanış fiyatları, G20

ülkelerinin 2009 yılı büyüme rakamları, AB ülkelerinin 2008 yılı nüfus artış hızları ve iller

itibariyle 2005 yılı GSMH rakamları, İktisat Fakültesi 5.yarıyıl öğrencilerinin Ekonometri final

sınav notları v.b.

Yatay kesit verileri iktisat ve sosyal bilimlerde yoğun olarak kullanılmaktadır. Zamanın

belirli bir noktasında bireyler, hane halkları, firmalar ve illerden derlenen veriler, mikro iktisadi

hipotezleri test etmek ve iktisat politikalarını değerlendirmek açısından önemlidir.

Yatay kesit verilerinin önemli bir özelliği, ana kütleden rassal örnekleme ile edildiği

varsayımına dayanmasıdır. Örneğin hane halkı tüketimi ile geliri arasında bir ilişkinin

16

araştırıldığı ekonometrik bir uygulamada, Türkiye’deki hane halklarından örneğin 100 tanesi

rassal olarak çekilmekte ve bu ailelerden yatay kesit verileri elde edilmektedir.

Yatay kesit verilerin ekonometrik modelde gösterimi aşağıdaki gibidir.

0 1i iC Y

Bu modelde yer alan

iC = i. tüketicinin belli zaman noktasındaki tüketimi,

iY =i. tüketicinin belli zaman noktasındaki geliri

0 ve 1 modelin parametreleridir. Yatay kesit verilerinin kullanıldığı modellerin özelliği

zaman boyutunun sabit olmasıdır. Modelin matematiksel biçimi i=1,2,…,n tüketici için

aynıdır.

1.4.3. Panel Veri

Panel veriler, yatay kesit verilerinin çeşitli zamanlardaki değerleridir. Zaman boyutu

olan bireysel mikro-birimlere ile ilgili gözlemler panel verilerdir. İMKB-30’da yer alan hisse

senetlerinin 1990- 2009 yılları arasındaki getiri rakamları, 1960 -2009 imalat sanayi sektörler

itibariyle verimlilik rakamları, 1950- 2009 AB ülkeleri işsizlik oranları v.b.

Hem zaman hem de kesit verilerinin kullanıldığı basit bir modelde bu durum aşağıdaki

gibi gösterilir.

0 1it itC Y

Yine bu modelde i’ler yatay kesit verisini, t’ler ise zaman serisi verisini göstermektedir.

itC =t zaman noktasında i. tüketicinin belli zaman noktasındaki tüketimi,

itY = t zaman noktasında i. tüketicinin belli zaman noktasındaki gelirdir.

Buna göre panel veri setindeki n birim sayısı gösterilir iken, zaman dönemleri sayısı ise

T ile gösterilir. Örneğin 13 hisse senedinin haftalık iş günü (5) itibariyle kapanış fiyatlarına

sahip isek n=13, T=5 olmak üzere elimizde bu örnek ile ilgili n x T= 13x 5= 65 veri vardır.

Panel verinin temel özelliği, her bir mikro birimin belirli bir zaman dönemi için

gözlemlenmesidir.

Kısaca;

Zaman serisi verileri çoklu zaman dönemlerinde tek bir birim içerir.

17

Yatay-kesit verisi çoklu birim içerip tek bir zaman noktasında gözlemlenir.

Panel veri çoklu birim içerir, her birim için iki veya daha fazla zaman

noktasında gözlemlenir.

Ekonometrik modelde kullanılan veriler gelir, tasarruf, tüketim, döviz kuru, faiz oranı

gibi nicel değişken olabildiği gibi, cinsiyet, eğitim düzeyi (ilköğretim, lise, üniversite) gibi nitel

değişken de olabilir. Yine bir örnek üzerinde açıklayacak olursak; bir iş yerinde çalışanların

kazançları, işyerindeki deneyimlerine ve eğitim düzeylerine bağlıdır. Kazanca ilişkin

ekonometrik model aşağıdaki gibi yazılabilir.

0 1 1 1 2 1,....,i i i iY X X u i n , odelde;

Yi= i. çalışanın maaşı

X1=i. çalışanın işyeri deneyimi (1yıl,5yıl, 16 yıl gibi)

X2= i. çalışanın eğitim düzeyi ( lise ve üniversite)

ifade etmektedir.

n sayıda kişiye ait verilerin yer alacağı kazanç modelinde kullanılan değişkenlerde maaş

ve işyeri deneyimine ilişkin veriler nicel olmasına karşın, eğitim düzeyi nitel bir değişkendir.

Nitel değişkenler, ekonometrik modele gölge değişken yöntemi ile modele ilave edilir. (Gölge

değişkenler başlığı altında incelenecektir.)

1.5. İktisadi Veri Kaynakları

İnternetin gelişmesiyle birlikte ekonometrik uygulamalarda ihtiyaç duyulan iktisadi

verileri elde etmek oldukça kolaylaşmıştır. Türkiye ekonomisi ve diğer ülkelerin iktisadi

verilerine ulaşabilmek için aşağıdaki kurumların web sayfaları kullanılmaktadır. Türkiye

İstatistik Kurumu (TUİK), Merkez Bankası (MB) : Türkiye ekonomisi ile ilgili makro ve

finansal verilere ulaşmak mümkündür. Hazine Müsteşarlığı, Dünya Bankası, IMF ve OECD

veri tabanlarında Türkiye ve diğer ülkeler ait veriler yayınlanmaktadır.

1.6. Ekonometride Bilgisayarın ve Paket Programların Yeri

Son çeyrek yüzyılda bilgisayar teknolojisindeki gelişim, özellikle PC’lerin yaygın

kullanımı ve buna bağlı olarak ekonometrik paket programların yazılımı, ekonometrik

çalışmalara ve uygulamalara önemli ölçüde katkıda bulunmuş, ekonometrinin artan ivmesinde

önemli katkısı olmuştur. Derslerimiz ilerledikçe ekonometrik modellerin tahmini için

kullanılan matematiksel işlemlerin hiç de kolay olmadığı hep birlikte göreceğiz. Ancak paket

program aracılığı ile bu modellerin çözümü ancak birkaç dakika almaktadır.

Uygulamada en çok kullanılan programlar arasında E-Wievs, SPSS, MINITAB,

MİCRO TSP ‘yi sayabiliriz.

18

Uygulamalar

19

Uygulama Soruları

1) Aşağıdakilerden hangisi ekonometrinin bileşeni değildir?

a) İstatistik

b) Matematik

c) İktisadi istatistikler

d) Matematiksel istatistik

e) Psikoloji

2) Aşağıdakilerden hangisi ekonometrik çalışmalarda nadiren kullanılan veri

türüdür?

a) Zaman serisi verisi

b) Deneysel veri

c) Yatay kesit verisi

d) Panel veri

e) Nicel veri

3) Aşağıdakilerden hangisi panel veridir?

a) Türkiye, Yunanistan ve İsrail’in 1980-2013 yılları arasındaki yıllık savunma

harcamaları

b) 2010 girişli Ekonometri Bölüm öğrencilerinin Ekonometri Dersi final notları

c) Türkiye ekonomisi için 1990-2013 yılları arasındaki katma değer rakamları

d) 2012 yılında Türkiye’deki ilk 500 şirketin sermaye rakamları

e) AB ülkelerinin 2012 yılındaki kişi başına milli gelir rakamları

4) Aşağıdakilerden hangisi matematiksel modelin unsurlarından biri değildir?

a) Hata terimi

b) Bağımlı değişken

c) Katsayı

d) Denklem

e) Bağımsız değişen

20

5) Aşağıdakilerden değişkenlerden hangisi nitel özelliğe sahiptir?

a) Mevsim

b) Üretim

c) Ekili alan

d) Yağış miktarı

e) Çalışma süresi

6) Yatay kesit verilerinin bir özelliği değildir?

a) Ana kütleden rassal örnekleme ile edilir.

b) Çoklu birim içerir

c) Tek bir zaman noktasında gözlemlenir.

d) Nicel olmalıdır.

e) Zaman farklılıkları ihmal edilebilmektedir

7) Trend ve mevsimsellik özellikleri hangi tip verilerde kesinlikle görülmez?

a) Yatay kesit verisi

b) Panel veri

c) Zaman serisi verisi

d) Makro veri

e) Mikro veri

8) Aşağıdakilerden hangisi akım- akım ilişkisini göstermektedir?

a) Üretim- sermaye stoku

b) Katma değer-çalışma saati

c) Katma değer-sermaye stoku

d) Üretim- çalışma saati

e) Hiçbiri

21

9) “ Kişi Başına Milli Gelir rakamlarının zaman içerisinde artan bir …….. var”

ifadesinde boşluğa aşağıdakilerden hangisi gelmelidir?

a) İvmesi

b) Trendi

c) Mevsimselliği

d) Sonucu

e) Nedenselliği

10) Aşağıdakiler hangisi sadece yatay kesit verisinin kullanıldığı bir modeldir?

a) 0 1 1 1 2 1,....,i i i iY X X u i n

b) 0 1 1 1 2 1,....,t t t tY X X u t T

c) 0 1 1,...., 1,....,it it itY X u i n t T

d) 0 1 1 2 2 1,...., 1,....,it it it itY X X u i n t T

e) 0 1 1 1,....,t t tY X u t T

Cevaplar:

1 2 3 4 5 6 7 8 9 10

e e a a a d a b b a

22

Bu Bölümde Ne Öğrendik Özeti

Bu bölümde ekonometrinin amacı, gerekliliği ve metodolojisi üzerinde durduk.

Ekonometrinin nihai hedefinin, iktisat teorisini test etmek, politika yapıcılarına bilgi vermek ve

iktisadi zaman serilerinin gelecekte alacağı değerleri öngörmek olduğunu ve bu amaç için

matematik ve istatistik yöntemlerin yoğun biçimde kullanıldığını gördük.

Ekonometrik uygulamalarda yaygın olarak zaman serisi verisi, yatay kesit verisi ve

panel verinin kullanıldığı bilgisini takiben, bu veri çeşitlerinin özelliklerini öğrendik. Zaman

serisi veri ve panel veri gibi zaman boyutunu içeren veri setlerinin, çoğu iktisadi zaman serisinin

zaman boyutu boyunca korelasyonlu olması nedeniyle trend etkisini ve günlük, aylık, üçer aylık

zaman serisi verilerinin mevsimsellik özelliğini taşıdığını gördük. Zaman serisi verilerinde

gözlemlenen trend ve mevsimsellik özelliğinin yatay kesit verisinde olmadığı, yatay kesit

verilerinin rassal örneklemeye dayandığını öğrendik. İktisadi verilerin genellikle deneysel

olmayan diğer bir ifade ile gözlemlenmiş veriler olduğu üzerinde durduk.

İktisadi verilerin hangi kaynaklardan derlenebileceğini ve bilgisayar paket programı

kullanabilmenin ekonometri açıdan önemi üzerinde durduk.

23

Bölüm Soruları

1) Aşağıdakilerden hangisi ekonometrinin nihai hedefi değildir?

a) İktisadi değişkenler için geleceğin tahmini,

b) İktisadi olayların kantitatif ölçümlerle izahını yapabilmek,

c) İktisat teorisini test etmek,

d) İktisat politikası yapıcılarına bilgi vermek,

e) Parametre tahmini yapmak

2) Aşağıdakilerden hangisi makro veri değildir?

a) Enflasyon oranı

b) Milli Gelir

c) İşsizlik oranı

d) X Bankasının yıllık karı

e) Büyüme hızı

3) Aşağıdakilerden hangisi panel veridir?

a) 1990-2013 dönemi için Türkiye’deki enflasyon oranı rakamları

b) BİST 100 ‘de işlem gören hisse senetlerinin 30 Aralık 2013 kapanış fiyatları

c) AB ülkelerinin 1998- 2013 yılları itibariyle yıllık işsizlik oranları

d) OECD ülkelerinin büyüme oranları

e) 2013 yılı mahalli seçim sonuçları

4) Aşağıdaki değişkenlerden hangisine ait veriler ulusal veya uluslararası

elektronik veri tabanlarından elde edilemez?

a) X dondurma firmasının yıllık ciro rakamları

b) Amerika Birleşik Devletlerinin savunma harcamaları

c) Türkiye’nin Gayri Safi Yurtiçi Hasılası (GSYİH)

d) Dolar/Euro paritesi

e) Almanya’nın işsizlik rakamları

24

5) Aşağıdaki ifadelerden hangisi yanlıştır?

a) Matematiksel model kesin ilişkileri, ekonometrik model stokastik ilişkileri gösterir.

b) Ekonometrik modeli matematiksel modelden ayıran en önemli unsur bünyesinde

hata terimini barındırmasıdır.

c) Ekonometri bilimi, iktisat teorisini istatistik yöntemleri kullanarak test eder.

d) Hata terimi bağımlı değişken ile bağımsız değişken arasında deterministik (kesin)

olduğunu gösterir.

e) Hata teriminin değeri model dışında belirlenir.

6) 20 kişinin gelir düzeyi ile araç sahibi olma (var/yok) arasındaki ilişkinin tespiti

için kullanılan verilerin özellikleri aşağıdakilerden hangisidir?

a) Gelir Düzeyi nicel, araba sahibi olma nitel veri

b) Gelir Düzeyi nicel, araba sahibi olma nicel veri

c) Gelir Düzeyi nitel, araba sahibi olma nicel veri

d) Gelir Düzeyi nitel, araba sahibi olma nitel veri

e) Panel veri

7) Aşağıdakilerden hangisi ekonometri ile ilgili değildir?

a) İktisat

b) Fizik

c) İstatistik

d) Matematik

e) Veri

8) Aşağıdaki değişkenlerden hangisi mevsimsellik özelliğini göstermez.

a) Turizm gelirleri

b) Gayri Safi Yurtiçi Hasıla

c) Zirai Üretim

d) Turist sayısı

e) Savunma harcamaları

25

9) Bir işletmede çalışanların kazançlarının ( lira ), işyeri deneyimi (yıl), eğitim

düzeyi (ilköğretim, lise, üniversite) ve cinsiyetin (kadın-erkek) fonksiyonu olduğu

bilinmektedir. Buna göre bu işletmede 2016 yılı için çalışanların kazançları tahmin

edilmek istenirse kullanılan veri türü aşağıdakilerden hangisidir.

a) Zaman serisi verisi

b) Panel veri

c) Yatay kesit verisi

d) Makro veri

e) Stok veri

10) Feldstein-Horioka hipotezine göre bir ülkenin yurt içi tasarruf (S) ve

yatırımlarının (I) GSYİH’ya oranları arasındaki ilişki, uluslararası sermaye hareketliliği

hakkında bilgi vermektedir. Feldstein ve Horioka (1980) tam sermaye hareketliliğinden

bahsedebilmek için bu iki değişken arasında anlamlı bir ilişkinin olmaması gerektiği

savunmuşlardır. Buna göre Türkiye için Feldstein-Horioka hipotezini test etmek

amacıyla kullanılacak ekonometrik model aşağıdakilerden hangisidir?

a) 0 1 1,...,t t tI S u t T

b) 0 1/ / 1,...,t t t t tI GSİH S GSİH u t T

c) 0 1/ / 1,...,i i i iI GSİH S GSİH i N

d) 0 1 1,...,i iI S i N

e) 0 1/ / 1,...,t t t t tGSİH I GSİH S u t T

Cevaplar

1. e

2. d

3. c

4. a

5. d

6. a

26

7. b

8. e

9. c

10. b

27

2. REGRESYON ANALİZİNE GİRİŞ

28


2.1. Regresyon Analizine Giriş

2.2. Regresyon ve Korelasyon

2.3. Ana Kütle Regresyon Modeli

2.4. Hata Teriminin ( Rassal Hata) Tanıtılması

2.5. Örnek Regresyon Modeli

2.6. Hata Terimin Kaynakları

29


1) Regresyon analizi ne amaçla kullanılır?

2) Regresyon analizi ile korelasyon analizi aynı amaçla kullanılabilir mi?

3) Ana kütle regresyon modeli ile örnek regresyon modeli aynı mıdır?

4) Niçin örnek rgresyon modelini tahmin ederiz?

5) Rassal hata (hata terimi) ne amaçla modele dahil edilir?

30


Konu Kazanım Kazanımın nasıl elde edileceği

veya geliştirileceği

Regresyon analizinin amacı

İktisadi değişkenler

arasındaki ilişkinin

matematiksel kalıpla

ifade edilebileceği

Ders notları

Koşullu olasılık, koşullu

ortalama (beklenen değer)

koşullu varyans

Ana kütle regresyon

modelini kavramak

Ders notları, Uygulamaları

tekrar ederek, verilen soruları

cevaplandırarak

Regresyon ve korrelasyon

Regresyon ile

korelasyonun benzer ve

farklı yönlerini nedenleri

ile kavrabilmek

Ders notları

Ana kütle regresyon modeli

ve örnek regresyon modeli

Ana kütle regresyon

modeli ile örnek

regresyon modelinde yer

alan unsurları öğrenmek

ikisi model arasındaki

farklılığı anlamak

Ders notları

Hata terimi, kalıntı Ekonometrik modelin

özünün benimsenmesi

Ders notları, Uygulamaları

tekrar ederek, verilen soruları

cevaplandırarak

31

Anahtar Kavramlar

Rassal değişken

Koşullu olasılık

Koşulu ortalama (beklenen değer)

Koşullu varyans

Ana kütle regresyon modeli

Ana kütle regresyon doğrusu

Örnek regresyon modeli

Örnek regresyon modeli

Nedensellik

Regresyon

Korelasyon

Rassal hata (hata terimi)

Kalıntı

Serpilme diyagramı

32

Giriş

Bu bölüm regresyon analizin temelini oluşturmaktadır. Derslerimiz ilerledikçe devamlı

tahminden bahsedeceğiz. Parametreleri tahmin edeceğiz, rassal hatanın varyansını tahmin

edeceğiz. “Peki bu tahmin edilenlerin gerçek değerleri nelerdir?” sorusuna cevabımız “Bunları

hiçbir zaman bilemeyiz” olacaktır. Ancak Gujarati ’nin “Temel Ekonometri ” kitabının ilk

bölümü bize bilmediğimiz ana kütleyi tanıtmak amacıyla iyi bir okuma sunmaktadır.

Bu bölümde verilen kavramların çok iyi özümsenmesi gerekmektedir. Ana kütle, örnek

kütle kavramlarının ve unsurlarını özümsemeden diğer bölüme geçmemelisiniz.

Bölümün sonundaki EK 2,1’de bölümdeki veriler kullanılarak ana kütle regresyon

modeli oluşturulmuştur. Amaç ileriki derslerimizde tahmin edilen örnek regresyon doğrusuyla

neyi tahmin ettiğimizi daha iyi anlamak amacıyla sadece yol gösterici olması açısından

verilmiştir.

33

2.1. Regresyon Analizine Giriş

Regresyon kavramı ilk kez, anne-babaların boyları ile çocuklarının boyları arasındaki

ilişkiyi dikkate alan çalışmasında, İngiliz istatistikçi Sir Francis Galton (1822-1911) tarafından

kullanılmıştır. Galton, çalışmasında uzun boylu anne-babaların uzun boylu, kısa boylu anne-

babaların kısa boylu çocuklara sahip olma beklentisi karşısında, çocukların boylarının

uzunluklarının ortalama boy uzunluğuna yaklaşma eğiliminde olduğunu göstermiştir.

Günümüzde kullanılan anlamı ile regresyon, değişkenler arasındaki ilişkilerin

incelenmesidir. Regresyon analizi ile bir veya birden fazla değişkenin (bağımsız değişken)

değerindeki değişmelerin başka bir değişkenin (bağımlı değişken) değeri üzerindeki etkileri

araştırılmaktadır. Regresyon bağımlı ve bağımsız değişkenler arasında ilişki kuran

parametrelerin değerinin tahmin imkânı araştıran istatistiksel bir yöntemdir.

Bir regresyon modelinin kurulabilmesi için önsel olarak;

1. Sebep-sonuç ilişkisine göre bağımlı ve bağımsız değişken ayrımının,

2. Modelde yer alacak bağımsız değişkenlerin,

3. Modelin fonksiyonel biçiminin

belirlenmesi gerekir. Ancak sebep-sonuç ilişkisi ekonometride regresyonun dışında

olup, çoğu kez iktisat kuramı tarafından saptanmaktadır.

Ekonometri konularıyla ilgili literatürde en çok rastlanan ve ilgi gören model türü tek

denklemli doğrusal regresyon modelleridir. 1980 sonrası teorik ve uygulamalı ekonometrideki

hızlı gelişme ile birlikte iktisadi gerçekler ve veriler daha komplike modeller ile izah

edilebiliyorsa da, tek denklemli doğrusal modeller ekonometrik analizlerde hala önemli bir yer

tutmaktadır. Bunun sebepleri:

1. Geleneksel iktisat teorisi, bir sonucu bir dizi sebebe bağlamakta ve bunu tek

denklemli bir model çerçevesinde ele alan bir tutuma sahip bulunmaktadır.

2. Gerçekler çok defa basit kalıplara sokulamayacak kadar karmaşık olmasına rağmen,

iktisadi olaylarda sebep-sonuç ilişkilerinin doğrusal bir model içinde sunulması önemli ölçüde

kolaylık sağlamaktadır.

Tek denklemli doğrusal regresyon modellerinde yalnız bir bağımlı değişken vardır ve bu

bağımlı değişken bir ya da birden çok bağımsız değişkenin doğrusal fonksiyonu olarak

tanımlanmıştır.

Tek denklemli doğrusal regresyon modellerinde bağımsız değşken/değişkenlerden

bağımlı değişkene doğru tek yönlü bir ilişkinin olduğu varsayılmaktadır. Modelin bağımsız

kabul edilen değişken(ler)i, modelin bağımlı değişkeni tarafından etkilenmeyecektir. Diğer bir

ifade ile sistemde geri tepme (feedback) ve karşılıklı ilişki olmayacaktır. Regresyon modelleri

nedensellik ilişkisi üzerine kurulur. Nedensellik ilişkisi kuramsal ve önsel (a’priori) olmalı,

34

kısaca iktisat teorisi tarafından belirlenmelidir. İstatistiksel açıdan anlamlı bir ilişki, kendi

başına bir nedensellik ilişkisi anlamı taşımaz.

İktisadi ilişkilerin ölçülmesinde ilk adım, iktisadi ilişkileri yansıtan modellerde yer

alacak değişkenlerin tanımlanmasıdır. Bir ana kütlenin veya ondan çekilecek bir örneğin

birimleri bir veya birden çok özelliği bakımından gözlemlenebilir. Bu özellikler nicel ve/veya

nitel olabilir.

Modelde yer alan bağımsız değişken sayısına göre regresyon modelleri basit regresyon

ve çok değişkenli regresyon olmak üzere ikiye ayrılır. Bağımlı değişken sadece bir bağımsız

değişken tarafından açıklanıyorsa basit regresyon modeli, birden fazla değişken tarafından

açıklanıyorsa çok değişkenli regresyon modeli söz konusudur.

İlişkileri mümkün olduğu kadar basitleştirebilmek için, tek yönlü bir ilişki üzerinde

durulan ve bu ilişkinin de bağımlı ve bağımsız değişken olmak üzere sadece iki değişkeni

içerdiği şeklindeki varsayımdan hareketle, en basit durum basit regresyon modeli;

0 1 1,2......i i iY X u i n

ile gösterilirken, birden fazla bağımsız değişkenin yer aldığı çok değişkenli regresyon modeli;

0 1 1 2 2 .......... 1,2......i i i k ki iY X X X u i n

gibi gösterilir. Yukarıdaki modellerde de görüldüğü üzere, basit regresyon modelinde bağımlı

değişkeni açıklayan sadece bir tane bağımsız değişken (X) yer alırken, çok değişkenli regresyon

modelinde birden fazla k sayıda bağımsız değişken (X1,X2...........Xk ) vardır. i ise 1’den n’e kadar

olan gözlemleri ifade etmektedir. Her iki modelde de sadece tek bir bağımlı değişken (Y) yer

almaktadır.

Örneğin, bir malın talebi (D) en basit ifade ile malın fiyatının (P) fonksiyonudur. Malın

fiyatı artarsa malın talebi düşer, malın fiyatı düşerse de talebi artar. Fiyattan talebe doğru bir

nedensellik söz konusu olduğuna göre, talep bağımlı değişken, fiyat ise bağımsız değişkendir.

Buna göre basit regresyon modeli aşağıdaki gibi kurulacaktır.

1 2 1,2......t t tD P u t T

Ancak bir malın talebi, malın fiyatının yanı sıra bu malı talep eden kişilerin gelir

düzeyine (Y), malın tamamlayıcı malı varsa bu tamamlayıcı malın fiyatına (PT) ve nihayet rakip

mal varsa rakip malın fiyatına (PR) bağlı olarak değişkenlik gösterecektir. İlgili değişkenler

modele dahil edildiğinde, model çok değişkenli regresyon modeli olarak adlandırılacak ve

aşağıdaki şekilde gösterilecektir.

0 1 2 3 4 1,2......t t t Tt Rt iD P Y P P u t T

35

Yukarıdaki çok değişkenli regresyon modelinde malın talebi dört tane bağımsız değişken

ve hata teriminin (veya rassal hatanın-ui) doğrusal bir fonksiyonudur. Talep modelinin tahmini

ile gelir esnekliği ve çapraz esneklikleri tahmin etmek mümkün olacaktır.

Regresyon analizinde, değişkenler arasındaki ilişki fonksiyonel ya da kesin ilişkiler

olmayıp istatistiksel ilişkilerdir. Değişkenler arasındaki istatistiksel ilişkilerde, genellikle

stokastik (tesadüfi-rastlantısal) değişkenler yani olasılık dağılımı olan değişkenler kullanılır.

Regresyon analizinde de bağımlı değişken stokastik bir değişkendir. Fonksiyonel ya da kesin

ilişkilerde de değişkenler kullanılır, ancak bunlar tesadüfi ya da stokastik değil, deterministik

değişkenlerdir.

2.2. Regresyon ve Korelasyon

Regresyon analizi, korelasyon ile yakından ilişkili, ancak kavramsal olarak çok farklıdır.

Regresyonun korelasyona benzer yanı ikisinin de değişkenler arasında birlik ve beraberliği

aramalarıdır. Aralarındaki fark ise, regresyonun bir sebep-sonuç ilişkisi içinde yani nedensellik

ilişkisi içinde değişkenler arasındaki bağlantıyı aramasına karşılık, korelasyon analizi bu

şekilde bir sebep-sonuç ilişkisi olmadan, değişkenler arasındaki doğrusal ilişkinin yön ve

derecesinin saptanmasını sağlar.

Basit korelasyon analizinin amacı, yukarıda da ifade edildiği üzere iki değişken

arasındaki doğrusal ilişkinin yönünü ve derecesini ölçmektir. İstatistik dersinden hatırlanacağı

üzere basit korelasyon katsayısı

2 2

i i

i i

x yr

x y

formülü ile hesaplanmaktadır. Formülde yer alan unsurlar ise ,i i i ix X X y Y Y 'e eşittir.

Basit korelasyon katsayısı (r), 1 1r değerleri arasında yer alır. Regresyon analizinde ise

bağımlı değişkenin ortalama değeri, bağımsız değişken(ler)in değişmeyen değerlerine

dayanılarak tahmin edilmektedir.

Regresyon analizinde bağımlı ve bağımsız değişkenlerin ele alınmasında sebep-sonuç

ilişkisinden dolayı asimetri söz konusudur. Bağımlı değişkenin istatistiksel, tesadüfi olduğu

yani olasılık dağılımı bulunduğu varsayılır. Bu varsayım X bağımsız değişkeninin sabit bir

değeri için ana kütlede bağımlı değişkenin en az iki farklı değerinin bulunduğu anlamına

gelmektedir. Örneğin aynı gelir düzeyine sahip iki hane halkı reisinin aynı tüketim

harcamasında bulunmasını bekleyemeyiz. 1000 lira geliri olan bir aile reisi 950 lira tüketim

harcaması yapıyorken, aynı (1000 lira) gelire sahip olan bir başka aile reisi 650 lira tüketim

harcaması yapabilir. Tesadüfi ilişkinin bir gereği olan bu durum bir dağılım oluşturacaktır.

Öte yandan bağımsız değişkenlerin yenilenen örneklemlerde değişmeyen değerler aldıkları

varsayılmaktadır. Korelasyon analizinde herhangi iki değişkeni simetrik olarak ele alabiliriz.

Bağımlı ve bağımsız değişken ayrımı yoktur. Her iki değişkenin de tesadüfi olduğu

varsayılmıştır.

36

2.3. Ana kütle Regresyon Modeli

Regresyon analizi büyük ölçüde, bağımsız değişkenin değeri bilindiği ya da sabit olduğu

durumda bağımlı değişkenin ana kütledeki ortalama değeri ile ilgilenir. Regresyon analizine

başlangıç olarak basit regresyon modeli incelenecektir.

Basit regresyon modeli, bağımlı Y değişkeni ile bağımsız X değişkeni arasında bağlantı

sağlamaktadır. X’in her sabit değeri için rastlantısal ilişki gereği ana kütlede bağımlı değişkenin

en az iki farklı değerinin bulunması zorunludur. Böylece her iX değişkeni için farklı Y değerleri

elde edilecek, bu da bir dağılım oluşturacaktır.

Rastlantısal ilişkiyi açıklayabilmek için belirli bir zaman boyutu içinde, hane halkları

yatay kesitinde hipotetik veriler kullanılarak haftalık gelir ile haftalık tüketim harcamaları

arasında ilişki incelenecektir. Tüketim harcamaları, gelirin bir fonksiyonudur. Buna göre, X

haftalık gelir, Y ise tüketim harcamalarıdır. Öncelikle 60 aileden oluşan ana kütle, gelirleri

yaklaşık olarak aynı olan ailelerden oluşan 10 ayrı gruba ayrılır ve alt ana kütle olarak

adlandırılan her grup, aynı gelir düzeyindeki farklı ailelerin tüketim harcamalarını gösterir.

n=60 aile

Xi= Haftalık gelir ( birimi 100 lira)

Yi= Haftalık tüketim harcamalarını (birimi 100 lira) göstermektedir.

( Örneğin tablodaki 80 ile gösterilen gelir 8000 lirayı, 65 ile gösterilen tüketim harcaması ise

6500 lirayı ifade etmektedir.)

Xi 80 100 120 140 160 180 200 220 240 260

55 65 79 80 102 110 120 135 137 150

60 70 84 93 107 115 136 137 145 152

Yij 65 74 90 95 110 120 140 140 155 175

70 80 94 103 116 130 144 152 165 178

75 85 98 108 118 135 145 157 175 180

88 113 125 140 160 189 185

115 162 191

ni 5 6 5 7 6 6 5 7 6 7

Toplam 325 462 445 707 678 750 685 1043 966 1211

Kaynak: Gujarati

Tablo-2.1: Haftalık harcanabilir gelir ve tüketim harcaması

Tablo 2.1’deki her bir sütun alt ana kütle olarak adlandırılmakta ve sabit bir X

değerlerine karşılık gelen Y bağımlı değişkeninin koşullu dağılımını vermektedir. Buna göre,

yukarıdaki her bir sütun belli bir gelir düzeyine karşılık gelen tüketim harcamalarının koşullu

dağılımını verecektir. Tablodan da açıkça görüleceği üzere, belirli bir gelir düzeyine sahip (X)

bir gruba ait tüm hane halklarının aynı tüketim harcamasında (Y) bulunması beklenemez. Diğer

bir ifade ile bağımsız değişkenin (gelir) sabit değerine karşın bağımlı değişkenin (tüketim)

birbirinden farklı değerleri vardır. Örneğin, 80 lira haftalık gelire sahip 5 aile, 55, 60, 65, 70 ve

37

75 lira olmak üzere farklı tüketim harcamalarında bulunmaktadır. Bu farklı tüketim harcamaları

bir olasılık dağılım oluşturmaktadır.

Haftalık harcanabilir gelir (X) 80 lira iken birbirinden farklı 5 tane haftalık tüketim

harcaması olduğuna göre, bunların her birinin gerçekleşme olasılığı 1/5’dir. Diğer bir ifade ile

80 lira geliri olan 5 aileden oluşan bir alt ana kütleden rastlantısal olarak seçilen bir ailenin 55

lira haftalık tüketim harcaması olan aile olmasının koşullu olasılığı 1/5 ’e eşittir ve aşağıdaki

gösterilir:

55 80 1/ 5P Y X

Diğer bir alt ana kütle için örnek verecek olursak, haftalık harcanabilir geliri 220 lira

olan 7 aile vardır. Bu ailelerin tüketimleri birbirlerinden farklıdır ve her birinin gerçekleşme

olasılığı 1/7’dir. Buna göre 220 lira haftalık geliri olan 7 aileden oluşan bir alt ana kütleden

rastlantısal olarak seçilen bir ailenin 157 lira haftalık tüketim harcaması olan aile olmasının

koşullu olasılığı 1/7’ye eşittir ve aşağıdaki gibi gösterilir.

157 220 1/ 7P Y X

Bu uygulamada alt ana kütlelerin birim mevcutları farklıdır. Alt ana kütle birim

mevcutlarının aynı olması halinde, ana kütle içinde bütün alt ana kütlelerin koşullu olasılıkları

aynı olacaktır.

Her alt ana kütledeki ailelerden bazıları daha fazla, bazıları daha az harcarlarsa da

harcama rakamlarının söz konusu gelir düzeyini hedef alan bir değer etrafında toplanmaları

beklenebilir. Böylece olasılık dağılımlı her alt ana kütle için beklenen değer ya da koşullu

ortalama i iE Y X X (kısaca i iE Y X veya E Y ile gösterilir) hesaplanır. Beklenen

değer (koşullu ortalama) X veri iken Y rastlantısal değişkeninin çok sayıda veya meydana

gelişte alacağı değerlerin ortalamasıdır. Beklenen değerin hesaplanabilmesi için, Y’nin her alt

ana kütle için koşullu olasılıklarının bilinmesi gerekir. Beklenen değer iX ’nin doğrusal bir

fonksiyonudur.

i i i i ii iE Y X X Y P Y Y X X Y P Y X

Buna göre X=80 lira iken Y’nin koşullu ortalaması veya diğer bir ifade ile beklenen

değeri:

1 1 1 1 1

80 55 60 65 70 755 5 5 5 5

1 1(55 60 65 70 75) 325 65

5 5

E Y X

80 65E Y X

38

olarak hesaplanır. Kısaca aynı 80 lira gelir seviyesindeki 5 ailenin birbirinden farklı tüketim

harcamalarının koşullu ortalaması (beklenen değeri) 65 liraya eşittir.

Diğer bir alt ana kütle, X=220 lira iken Y’nin koşullu ortalaması veya beklenen değeri:

1 1 1 1 1 1 1220 135 137 140 152 157 160 162

7 7 7 7 7 7 7

1 1(135 137 140 152 157 160 162) 462 149

7 7

E Y X

220 149E Y X

olarak hesaplanır. Böylece 10 alt ana kütle için 10 tane koşullu ortalama (beklenen değer)

hesaplanacaktır. Haftalık gelir ve tüketim harcamaları için hesaplanan koşullu olasılık ve

koşullu ortalamalar Tablo-2.2’de yer almaktadır.

Xi 80 100 120 140 160 180 200 220 240 260

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

P Y X 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/6 1/7 1/6 1/6 1/7 1/6 1/7

1/7 1/7 1/7

E Y 65 77 89 101 113 125 137 149 161 173

( )Var Y 50 66 46.4 133.42 57.3 116.6 82.4 112 310.7 216.5

Tablo-2.2: Koşullu Olasılıklar, Koşullu Ortalamalar ve Koşullu Varyanslar

Her alt ana kütlenin bir dağılımı olduğuna göre, alt ana kütlelerin koşullu varyansları ve

dolayısıyla standart sapmaları hesaplanabilir. Bilindiği üzere varyans ve standart sapma olasılık

dağılımının dağılışını diğer bir ifade ile yayılımını ölçer. Alt ana kütle koşullu varyansı

aşağıdaki gibi hesaplanmaktadır.

2

22 1( )

n

i i i

ii i i i

Y E Y X X

Var Y E Y E Y X Xn

Örneğin X=80 iken Y’nin koşullu varyansını hesaplayalım. Gelir 80 liraya eşit iken,

tüketim harcamalarının koşullu ortalamasının ( 80 65E Y X ) 65 lira olduğu bilindiğine

göre, X=80 iken Y’nin koşullu varyansı

2 2

2 2 2 2 2

80 65

(55 65) (60 65) (65 65) (70 65) (75 65)50

5

i iE Y E Y X E Y

39

olarak hesaplanır. Hesaplanan Y’nin koşullu varyansı - 2

80 50iE Y E Y X -, hane halkı

tüketim harcaması Y’nin ortalama- 80 65E Y X -etrafında yayılımını ölçer.

Aynı şekilde X=100 iken Y’nin koşullu varyansı ise;

2 2

2 2 2 2 2 2

100 77

(65 77) (70 77) (74 77) (80 77) (85 77) (88 77)66

6

i iE Y E Y X E Y

olarak hesaplanır. Diğer alt ana kütle için hesaplanan koşullu varyans değerleri Tablo 2.2’de

verilmiştir. Hesaplamalara göre alt ana kütle varyanslarının farklı olduğu sonucuna varılmıştır

(Dikkat bu sonuç homoskedasite–eşit varyans varsayımında kullanılacaktır.)

Ana kütle regresyon doğrusu, iX veriyken Y’nin ana kütle ortalama dağılımının iX ile

fonksiyonel ilişkili olduğunu gösterir. Yani X’ deki değişmeye karşılık Y’nin ortalama tepkisini

gösterir. Böylece, ana kütle regresyon fonksiyonu,

1 2 iE Y X X

şeklinde ifade edilmektedir. Ana kütle regresyon fonksiyonunda yer alan 1 ve 2 modelin

bilinmeyen parametreleridir. 1 sabit terim veya kesim parametresi,

2 ise eğim parametresi

olarak adlandırılır. 1 parametresi, ana kütle regresyon doğrusunun koordinat sisteminde Y

eksenini kestiği nokta, 2 ise ana kütle regresyon doğrusunun eğimidir. 2 , X bağımsız

değişkenindeki 1 birimlik değişme gerçekleştiğinde ( | )iE Y X deki değişme miktarını, diğer bir

ifade ile marjinal değişmeyi göstermektedir ve aşağıdaki gibi ifade edilmektedir.

2

( | ) ( | )i iE Y X dE Y X

X dX

Regresyon analizinde doğrusallıktan kasıt, Y nin beklenen değerinin parametrelerin

doğrusal bir fonksiyonu olmasıdır. 1 ve

2 parametrelerinin üstlerinin 1 olması dolayısıyla

model doğrusaldır. Hem parametreler hem de değişkenler açısından doğrusal olan regresyon

modelleri birinci mertebeden regresyon modelleri olarak adlandırılır.

2

1 2 iE Y X X

40

İkinci dereceden doğrusal bir regresyon modelidir. Bağımsız değişkenin üstlerinin azamisi

modelin mertebesini verir.

BASİT REGRESYON MODELİNİN VARSAYIMLARI-I

1. X’in her değeri için, Y’nin ortalama değeri aşağıdaki doğrusal regresyon

fonksiyonu ile elde edilir.

1 2 iE Y X X

2. X’in bir değeri için Y’nin gözlemlenen değerleri, ortalama değerleri etrafında

dağılır ve aynı varyansa sahip olasılık dağılımları izler.

2

2( )i i iE Y E Y X X Var Y X

3. Y’nin örnek değerlerinin hepsi korelasyonsuz ve sıfır kovaryansa sahiptir.

Bu varsayım Y’ler arasında doğrusal bir birlikteliğin olmadığı anlamına gelir.

, 0i jCov Y Y i j

4. X rassal değişken değildir ve en azından iki farklı değer almak zorundadır.

X’in rassal olmadığı varsayımı, X’in değerinin bilindiği anlamına gelir. İstatistikte bu tür X

değerlerinin, “tekrarlanan örneklerde sabit” olacağı anlamına gelir. En az iki farklı değer

alması ( ) 0Var X anlamına gelir.

5. X’in her değeri için, Y değerleri ortalama etrafında normal dağılır. (isteğe

bağlı)

2

1 2 ,iY N X

Hata Teriminin (Rassal Hata) Tanıtılması

Regresyon analizinin özü, bağımlı değişken Y ile ilgili herhangi bir gözlemin, sistematik

bileşen ve rassal bileşen olarak iki kısma ayrılabilmesidir. Y’nin sistematik bileşeni, kendi

ortalamasıdır, 1 2 iE Y X X . Bu ortalama matematiksel bir beklenti olduğu için rassal

değildir. Y’nin rassal bileşeni, Yi ile koşullu ortalama değeri ( | )iE Y X arasındaki farktır. Rassal

hata terimi (iu ) olarak adlandırılan bu fark aşağıdaki gibi tanımlanmaktadır.

1 2 1 2( | )i i i i i iu Y E Y X Y X Y X

Yukarıdaki eşitliğine göre hata terimi, bağımlı değişkenin gözlemlenen değeri ile

beklenen değeri arasındaki farka eşittir. Hata terimi eşitliği yeniden düzenlenirse, aşağıdaki

basit doğrusal regresyon modeli elde edilir.

41

1 2i i iY X u

Böylece bağımlı değişken iY , bağımsız değişken

iX ve rassal hata terimiiu ’nin

sistematik olarak değişen bir bileşimi ile açıklanır.

Bu bağlamda birinci ve ikinci alt ana kütleler için hata terimleri aşağıdaki hesaplanır.

Xi=80 Xi=100

u1=55-65= -10 u1= 65-77= -12

u2=60-65= -5 u2=70-77= -7

u3=65-65= 0 u3=74-77= -3

u4=70-65= 5 u4=80-77=3

u5=75-65= 10 u5=85-77= 8

u6=88-77=11

Diğer 8 alt ana kütle için hata terimlerinin hesaplanması okuyucuya bırakılmıştır.

Yukarıda görüldüğü üzere X=80 lira iken, hata terimi -10,-5, 0, 5 ve 10 olmak üzere 5 farklı

değer almıştır.

( | )i i iu Y E Y X ve bu bağlı olarak yukarıdaki hesaplamalara göre iY ve hata terimi

iu ’nin, sadece rassal olmayan 1 2 iE Y X X terimi ile farklılık gösterdiği

görülmektedir. Buna göre Y rassal olduğu için hata terimi u’da rassal olacaktır.

Dolayısıyla hata terimi de bağımlı değişken Y gibi olasılık dağılımlıdır ve hata teriminin

de koşullu ortalaması ve koşullu varyansı hesaplanır. Hata teriminin beklenen değeri( koşullu

ortalaması) aşağıdaki gibidir.

1 2( | ) 0i i iE u X X E Y X X X

X veri iken rassal hata terimi iu , artı ve eksi değer alabilen gözlenemeyen bir

değişkendir ve hata teriminin ortalama değeri sıfırdır.

Bu aşamada verilen ana kütle ilgili hata terimlerinin ortalama değerlerini ve

varyanslarını hesaplayalım.

X=80 lira iken her bir hata teriminin koşullu olasılığı 1/5 ’e eşittir.

10 80 5 80 0 80

5 80 10 0 1 58

P u X P u X P u X

P u X P u X

42

Böylece X=80 lira iken hata teriminin koşullu ortalaması;

1 1 1 1 180 ( 10) ( 5) 0 5 10

5 5 5 5 5

1( 10) ( 5) 0 5 10 0

5

E u X

X=80 lira iken hata teriminin koşullu varyansı ise ;

2 2

2 2 2 2 2

80 0

( 10 0) ( 5 0) (0 0) (5 0) (10 0)50

5

i iE u E u X E u

olarak hesaplanmıştır. Benzer şekilde X=100 lira iken elde edilen hata terimine ilişkin olasılık

dağılımının koşullu ortalama ve koşullu varyansını da hesaplayabiliriz. Öncelikle X=100 lira

iken her bir hata teriminin koşullu olasılığı 1/6 ‘ ya eşittir.

12 100 7 100 3 100

3 100 8 100 11 100 1 6

P u X P u X P u X

P u X P u X P u X

Böylece X=100 lira iken hata teriminin koşullu ortalaması;

1 1 1 1 1 1100 ( 12) ( 7) ( 3) 3 8 11

6 6 6 6 6 6

1( 12) ( 7) ( 3) 3 8 11 0

6

E u X

X=100 lira iken hata teriminin koşullu varyansı ise;

2 2

2 2 2 2 2 2

100 0

( 12 0) ( 7 0) ( 3 0) (3 0) (8 0) (11 0)66

6

i iE u E u X E u

olarak hesaplanmıştır.

Burada dikkat dikkat edilmesi gereken iki önemli sonuç vardır.

1. Hata teriminin koşullu ortalaması (beklenen değeri) sıfıra eşittir. Diğer 8 alt ana kütle

için hesaplamalar okuyucuya bırakılmıştır. Bu hesaplamalar yapıldığında her alt ana

kütle için hata teriminin koşullu ortalamasının sıfır olduğu görülecektir.

43

2. Hata teriminin koşullu varyansı ile bağımlı değişken Y ‘nin koşullu varyansı her alt

ana kütle için eşittir. Burada da diğer 8 alt ana kütle için hesaplamalar okuyucuya

bırakılmıştır.

2 2

80 80 50i iE Y E Y X E u E u X

2 2

100 100 66i iE Y E Y X E u E u X

Y ve u yalnızca bir sabit ( yani, rassal olmayan bir faktör) ile farklılık gösterdiği için,

varyansları özdeş veya 𝜎2‘ye eşit olması gerekir. Buna göre; hata terimi ile bağımlı değişken

aynı dağılıma sahiptirler. Ancak dağılımın ortalamaları farklıdır. Hata teriminin koşullu

ortalaması sıfır - 0iE u X X -iken, bağımlı değişkenin koşullu ortalaması 1 2 iX ’dır -

1 2i iE Y X X X -.

Şekil 2.1. Y ve u için olasılık yoğunluk fonksiyonları

44

Basit regresyon modelinin hata terimi iu varsayımları aşağıdaki gibidir.

BASİT REGRESYON MODELİNİN VARSAYIMLARI-II

6. X’in her değeri için, Y’nin değeri:

1 2i i iY X u

7. Rassal hata iu ’nin beklenen değeri,

0i iE u X

Bu varsayım 1. varsayıma eşdeğerdir, 1 2 iE Y X X .

8. Rassal hata iu ’nin varyansı sabittir. (Bu varsayım homoskedasite/eşit varyans

olarak adlandırılmakta olup, ilerleyen derslerimizde detaylı ele alınacaktır.)

2 2

2

i i i iE Y E Y X X E u E u X X 2( )i iVar u Var Y

Rassal değişkenler Y ve u , aynı varyansa sahiptirler.

9. Rassal hatalar iu ve ju nin herhangi bir çifti arasındaki kovaryans,

, , 0i j i jCov u u Cov Y Y

Bu varsayımın daha güçlü biçimi, rassal hatalar iu ’nin istatistiksel olarak bağımsız

olması halidir. Bu durumda bağımlı değişken Y’nin değerleri de istatiksel olarak bağımsızdır.

(Bu varsayımdan sapma otokorelasyon olarak adlandırılmakta olup, ilerleyen derslerimizde

detaylı ele alınacaktır.

10. iu değerleri, ortalamaları etrafında normal dağılır.(isteğe bağlı)

20,iu N

Y değerleri normal dağılırsa hata terimleri de normal dağılacaktır.

Özet ile bağımlı değişken Yi’nin bileşenleri ile ilgili özellikler:

Sistematik bileşen (1 2 iX ); alt ana kütle ortalamalarından geçen bir doğru olup ana

kütle regresyon doğrusu olarak adlandırılır ve aşağıdaki gibi gösterilir.

1 2 iE Y X X

Ana kütle regresyon fonksiyonunda yer alan unsurlardan 1 , X=0 olduğunda Y’nin beklenen

değerine eşittir.

1 ( | 0)E Y X

45

Ancak 1 ’ın bu açıdan yorumlanması, X’in 0 etrafında veri bulunmasına bağlıdır. Aksi halde

bu yorum geçerli değildir. 1 , genel olarak modelde yer almayan ancak bağımlı değişken

üzerinde etkili olduğu bilinen değişkenlerin ortalama etkisini göstermektedir.

2 , yukarıda da değinildiği üzere, X' teki bir birimlik değişme karşısında Y’nin beklenen

değerindeki ( | )iE Y X değişme miktarını, diğer bir ifade ile marjinal değişmeyi verir. 2 aynı

zamanda ana kütle regresyon doğrusunun eğimidir.

2

( | ) d ( | )

d

i i

i i

E Y X E Y X

X X

Şekil 2.2 İktisadi model: haftalık gelir ve tüketim harcamaları arasındaki ilişki

Stokastik bileşen hata terimlerini simgeleyen iu , bağımlı değişkenin gözlemlenen

değeri (iY ) ile bağımlı ve bağımsız değişken arasında ortalama ilişkiyi gösteren (

1 2 iX )

kısım arasındaki farka eşittir. Alt örnekler itibariyle dikkate alındığında, hata terimi her alt ana

kütlenin birimlerinin alt ana kütle ortalamasından sapmalarını göstermekte, eğer ( | )i iY E Y X

ise artı, ( | )i iY E Y X ise eksi değer almaktadır.

iu , bağımlı değişken ( iY ) ile aynı özellikleri göstermesine rağmen gözlemlenemeyen

rassal değişkendir.

i i i iY E Y X u burada 1 2 iE Y X X olduğuna göre

1 2i i iY X u

Hata terimi, rastlantısal bir değişken olduğuna göre bağımlı değişken (Y) gibi hata terimi

de olasılık dağılımına sahiptir ve dolayısıyla koşullu ortalaması (beklenen değeri) ve koşullu

varyansı hesaplanabilir.

Ana kütle regresyon doğrusunun bağımlı değişkenin beklenen değerlerinden geçtiği

varsayımı, hata terimlerinin beklenen değerlerinin sıfır olduğu anlamına gelmektedir.

46

Şekil-2.1: Ana kütle Regresyon Fonksiyonu

Yukarıdaki şekilde görüldüğü üzere; n sayıdaki (yukarıdaki örnekte n 60’a eşittir.) Y ve

X gözlem çiftleri bir dağılım diyagramı üzerinde gösterilebilir ki biz bunu serpilme diyagramı

olarak adlandırıyoruz. Geometrik olarak ana kütle regresyon doğrusu, açıklayıcı değişkenlerin

sabit değerlerine karşılık gelen bağımlı değişkenin koşullu ortalamalarından (beklenen

değerlerinden) geçmektedir.

Örnek Kütle Regresyon Modeli

Uygulamada ana kütlenin gözlemlenememesi ve dolayısıyla 1 2 iX doğrusunun

bilinmemesi nedeniyle, ana kütle yerine çoğu kez örnekten hareket edilmektedir. 1 , 2 ve

hata teriminin varyansı (2 ) bilinmeyen parametrelerdir. Bu parametreler ana kütle verileri

yerine örnek gözlemlerine dayanılarak istatistiksel olarak tahmin edilir. Genellikle X’ in sabit

değerleri için, Y ’nin örnekleme değerleri bulunmaktadır.

47

Yukarıdaki ana kütleden rastlantısal çekilen iki örneğe ait veriler aşağıdaki gibidir.

ÖRNEK 1 ÖRNEK 2

Y X Y X

65 80 55 80

80 100 74 100

79 120 90 120

113 140 103 140

125 160 107 160

115 180 135 180

144 200 144 200

157 220 160 220

155 240 189 240

178 260 150 260

Yukarıdaki iki farklı örneklemde görüldüğü üzere X’in değeri, tekrarlanan

örneklemlerde değişmemekte, sabit kalmaktadır. Ancak Y stokastik (rastlantısal) bir değişken

olduğu için X’ in sabit her bir değerine birden fazla Y değeri karşılık gelmekte ve dolayısıyla

yukarıda da görüldüğü üzere yinelenen örneklemlerde Y’nin değeri değişmektedir. Pek tabiidir

ki; bağımlı değişkene ait veriler farklı olduğu için her iki örnekten farklı örnek regresyon

doğruları elde edilecektir. Buna göre Örnek 1 ve Örnek 2’ye ait regresyon doğruları Şekil 2.2’de

verilmiştir.

Şekil-2.2: Örnek regresyon doğruları

Regresyon analizdeki birinci amaç, örneklem verilerinin kullanılarak tahmin edilen

örnek regresyon fonksiyonundan (diğer bir ifade ile örnekten tahmin edilen bilgilerle) ana kütle

regresyon fonksiyonunu tahmin etmektir. Örnek regresyon fonksiyonu aşağıdaki gibi ifade

edilmektedir.

1 2ˆ ˆˆ

i iY X

48

Burada îY , ana kütle regresyon modelindeki bağımlı değişken Y’nin koşullu ortalamasının-

( | )E Y X - tahminidir. Diğer unsurlar 1 , 2 sırasıyla anakütle parametreleri 1 ve 2 nin

tahmini verir. Buradan örnek kütle regresyon modeli aşağıdaki gibi yazılır.

1 2ˆ ˆ ˆ

i i iY X u

Denklemde yer alan îu , kalıntı olarak adlandırılmakta olup ana kütledeki hata terimini iu ’nin

tahminidir. Böylece ana kütle regresyon modeli

1 2i i iY X u

İken, örnek kütle regresyon modeli

1 2ˆ ˆ ˆ

i i iY X u

ile ifade edilir . Burada önemli bir husus, ana kütle yerine örnekten hareket edildiği durumda

ana kütle regresyon denklemi ve dolayısıyla ana kütle hata terimi iu bilinmediği için

iu ’nin

varyansı hesaplanamayacağıdır. Örnek regresyon fonksiyonu mümkün olduğunca ana kütle

regresyon fonksiyonuna yakın tahmin edilmelidir.

Şekil-2.3: Anakütle ve örnek regresyon doğruları

Şekil-2.3 ‘de de görüldüğü üzere ana kütle regresyon doğrusu her alt ana kütle için

hesaplanan bağımlı değişkenin beklenen değerlerinden geçerken, örnek regresyon doğrusu

bağımlı değişkenin tahmini değerlerinden geçmektedir.

Hata Teriminin Kaynakları

1. Spesifikasyon (belirlenme) hataları

49

- Dışlanmış değişken: Modelde yer alması gereken bağımsız değişken veya

değişkenlerin bilerek ya da bilmeyerek model dışında bırakılması

- Gereksiz değişken: Bağımlı değişken üzerinde etkili olmadığı halde bazı değişkenler

modelde etkileyici (bağımsız) değişken olarak yer verilmesi

- Matematiksel biçimleme hatası: Değişkenler arasındaki fonksiyonel ilişki doğrusal

olmadığı halde doğrusal olarak ele alınması

-Eşanlı modelin tek denklem ile ifade edilmesi: Değişkenler arasında karşılıklı

etkileşim olduğu halde, ilişki tek yönlü gibi ele alınarak tek denklemli modelin çözümü

2. Ölçme ve birleştirme hataları

3. Aynı iktisadi olay için bireylerin davranışındaki farklılıklar.

EK 2.1: Ana kütle regresyon fonksiyonunun belirlenmesi

Tüketim harcamaları ve gelir ile ilgili hipotetik verilerden ana kütle regresyon modelini

oluşturalım.

Öncelikle hatırlanacağı üzere, ana kütle regresyon modeli aşağıdaki gibi

1 2( )E Y X X

veya diğer bir şekliyle

1 2iY YX X

ile gösterilmektedir. Burada X , X bağımsız değişkeninin ortalaması ki; bu X rassal olmadığı

için koşulsuz ortalamadır. iYX , Y’nin X ‘bağlı koşullu ortalamasını göstermekte olup, ( )E Y X

’nın diğer bir gösterim şeklidir. Y , Y’ nin koşulsuz ortalamasıdır ve Y’nin koşullu ortalaması

ile koşulsuz ortalaması eşittir (iY YX ).

Amacımız 1 ve 2 ’in sayısal değerlerini bulmaktır. Hatırlanacağı üzere her alt ana

kütlenin koşullu ortalaması (beklenen değeri) hesaplanmıştı.

Öncelikle hesaplanmış olan alt ana kütle koşullu ortalamaları kullanılarak ana kütle

regresyonun doğrusunun eğimini veren 1 parametresinin değeri hesaplanacaktır. 2 marjinal

etkiyi ifade ettiğine ve X’ deki 1 birimlik değişme karşılığında Y’nin beklenen değerindeki

değişmeyi verdiğine göre aşağıdaki gibi hesaplanır.

50

2

2 1

100 80 77 65 12den

100 80 20

E Y X E Y X

X X

2 0.6

veya başka iki noktadan;

2

2 1

220 200 149 137 12den

220 200 20

E Y X E Y X

X X

2 0.6

veya,

2

3 1

120 80 89 65 24den

120 80 40

E Y X E Y X

X X

2 0.6 ’ye eşittir. 1 regresyon doğrusunun eğimine eşit olduğu için hangi iki

noktayı alırsanız sonuç değişmeyecektir, Doğrunun eğimi her noktada sabittir.

Bağımsız değişkenin (X) koşulsuz ortalaması x :

5 6 7 10420

80 100 ........................... 26060 60 60 60

x

173.67x

olarak hesaplanır.

Bağımlı değişkenin(Y) koşulsuz ortalaması Y :

7272

121.260

ij

Y YX

Y

N

sonucuna ulaşılır. Bu değer aynı zamanda Y’nin koşullu ortalamasına ( YX ) eşittir.

veya,

5 6 5 6 7 727265 77 89 161 173 121.2

60 60 60 60 60 60Y

51

hesaplanır. Y ve X’in koşulsuz ortalamaları ve 1 hesaplandığına göre 0 aşağıdaki gibi

hesaplanır.

1 2Y x

1121.1 0.6 173.67

1 17

Böylece anakütle regresyon denklemi

( | ) 17 0.6i iE Y X X

Olarak bulunmuş olur. Anakütle regresyon denklemine göre gelir 100 lira artarsa tüketim 60

lira artacaktır. Tanım gereği 0.6 bu ana kütle için marjinal tüketim meyline eşittir. Otonom

parametre ise zorunlu tüketim harcamalarının 1700 lira olduğunu göstermektedir.

Yukarıdaki denklem sonraki derslerimizde tahmin edeceğimiz ana kütle regresyon

denklemidir. Bu çözüm sadece sizin “Neyi tahmin ediyoruz” sorunuza cevap olması için

verilmiştir.

52

Uygulamalar

53

Uygulama Soruları

Bir yatırımcının sahip olduğu portföydeki 18 hisse senedinin risk ve getiri rakamları

aşağıdaki tabloda verilmiştir.

Ri 6 10 14 18

Gij

1 4 8 -6

3 5 -6 18

2 4 12 -9

2 3 9 17

1 12

ni 4 4 5 5

Toplam 8 16 24 32

Ri= Risk ( %) , Gi= Getiri (%) n=18

1. Hisse senetleri riski ile getirilerinin yer aldığı tabloyu genel özellikleri ile

yorumlayalım.

Yatırımcının portföyü bir ana kütleyi temsil etmektedir. Getiri, riskin fonksiyonu olduğu

varsayımı altında; risk bağımsız değişken, getiri bağımlı değişkendir. Kısaca risk

değişkeninden getiri değişkenine doğru bir nedensellik ilişkisi vardır. Tabloda 18 hisse senedi

için, hisse senedinin riskine karşılık gelen hisse senedi getirilerin dağılımı yer almaktadır. Hisse

senetleri sahip oldukları risk itibariyle 4 alt ana kütleye ayrılmıştır. Her alt ana kütle veya her

sütun, sabit bir riske karşılık gelen getiri dağılımını diğer bir ifade ile risk veri iken getirinin

koşullu dağılımını vermektedir. Örneğin riski % 6 olan hisse senetlerinin getirisi %1 ile %3

arasında değişiyor iken, riski % 14 olan hisse senetlerinin getirisi -%6 ile %12 arasında

değişmektedir.

2. Risk veri iken, hisse senedi getirilerinin koşullu olasılıkları hesaplayalım.

Yukarıdaki tabloya göre örneğin %10 riske sahip hisse senetleri için %4, %5 , %4

ve %3 olmak üzere 4 farklı getiri oranının olduğu gözlemlenmektedir. Buna göre; riski %10

olan hisse senetlerinden herhangi birini elde etme olasılığı 1/4 ‘e eşittir.

4 10 5 10

4 10 3 10 1/ 4

P G R P G R

P G R P G R

Benzer şekilde %18 riske sahip hisse senetleri için -% 6, %18, -%9, %17 ve %12 olmak

üzere 5 farklı getirinin gerçekleştiği görülmektedir.. Buna göre; riski %18 olan bu hisse

senetlerinden herhangi birini elde etme olasılığı 1/5‘ye eşittir.

6 18 18 18 9 18

17 18 12 18 1/ 5

P G R P G R P G R

P G R P G R

54

Böylece risk veri iken hisse senedi getirilerinin koşullu olasılıkları aşağıdaki tablodaki

gibidir.

Ri 6 10 14 18

i iP G G R R

1/4 1/4 1/5 1/5

1/4 1/4 1/5 1/5

1/4 1/4 1/5 1/5

1/4 1/4 1/5 1/5

1/5 1/5

ni 4 4 5 5

3. Hisse senedi getirilerinin koşullu ortalama (beklenen değeri) değerlerini

hesaplayalım.

Örneğin riski %14 olan 5 hisse senedinin getirileri %8, -%6, %12, %9, %1’e eşittir.

Hisse senedi getirilerinin koşullu olasılığı Uygulama 2 de hesaplandığı üzere 1/5’e eşittir. Buna

göre riski %14 olan 5 hisse senedinin getirilerinin koşullu ortalaması (beklenen değeri)

aşağıdaki gibi hesaplanabilir.

1 1 1 1 114 8 ( 6) 12 9 1

5 5 5 5 5

1(8 ( 6) 12 9 1) 4.8

5

E G R

Aynı şekilde riski % 6 olan 4 hisse senedinin getirileri %1, %3, %2 ve %2’ye eşittir.

hisse senedinin getirilerinin koşullu olasılığı ise 1/4’e eşittir. Buna göre riski % 6 olan 4 hisse

senedinin getirilerinin koşullu ortalaması (beklenen değeri) aşağıdaki gibidir.

1 1 1 16 1 3 2 2

4 4 4 4

1(1 3 2 2) 2

4

E G R

Buna göre diğer alt ana kütleler içinde aynı hesaplama yapılırsa aşağıdaki tablonun

son satırı elde edilecektir.

Ri 6 10 14 18

iE G R R 2 4 4.8 6.4

Tabloda görüldüğü üzere hisse senetlerinin riski arttıkça, hisse senedi getirilerinin

koşullu ortalaması da artmaktadır. Daha öncede ifade edildiği üzere bağımlı değişkenin

koşullu ortalaması, bağımsız değişken X’in doğrusal bir fonksiyonudur.

4. Hisse senedi getirilerinin koşullu ortalama değerleri bilindiğine göre her alt

ana kütle için hata terimlerini hesaplayabiliriz.

55

Örneğin birinci alt ana kütlede hisse senetleri getirilerinin gözlemlenen değerleri

sırasıyla %1, %3, %2 ve %2’e eşittir. Hisse senetleri getirilerinin koşullu ortalamasının da %2

olduğu bilindiğine göre

( | 6)i iG E G R u ’dan

( | )i i iu G E G R R olacak ve ( | 6) 2E G R olduğu bilindiğine göre hata

terimleri sırasıyla

1 1 2 1u

2 3 2 1u

3 2 2 0u

4 2 2 0u

olarak hesaplanır. Diğer alt ana kütlelerin de hata terimleri aynı şekilde hesaplanmış ve

aşağıdaki tabloda verilmiştir

Ri 6 10 14 18

uij

-1 0 3.2 -12.4

1 1 -10.8 11.6

0 0 7.2 -15.4

0 -1 4.2 10.6

-3.8 5.6

Yukarıdaki tablodan da görüldüğü üzere riskin sabit değerine karşın hata terimi

birbirinden farklı değerler almaktadır. Böylece hata terimi rassal bir değişkendir ve olasılık

dağılımı vardır.

5. Uygulama 4’de hesaplanan hata terimlerinin koşullu olasılıklarını hesaplayalım.

Örneğin birinci alt ana kütle için koşullu olasılıkları aşağıdaki gibi hesaplayabiliriz;

1 6 1 10

0 10 0 10 1/ 4

P u R P u R

P u R P u R

Ri 6 10 14 18

i iP u u R R

1/4 1/4 1/5 1/5

1/4 1/4 1/5 1/5

1/4 1/4 1/5 1/5

1/4 1/4 1/5 1/5

1/5 1/5

ni 4 4 5 5

56

6. Uygulama 5 de hata terimlerinin koşullu olasılıkları hesaplandığına göre, Uygulama

4’de hesaplanan hata terimlerinin koşullu ortalamalarını (beklenen değerlerini)

hesaplayabiliriz.

Örneğin Riskin %18 olduğu alt ana kütle için hesaplanan hata terimlerinin koşullu ortalaması

1 1 1 1 114 ( 12.4) 11.6 ( 15.4) 10.6 5.6

5 5 5 5 5

1( 12.4) 11.6 15.4 10.6 5.6 0

5

E u R

Ri 6 10 14 18

iE u R R 0 0 0 0

7. Risk veri iken hisse senedi getirilerinin koşullu varyansını hesaplayalım.

Örneğin risk %10 iken getirinin koşullu varyansı aşağıdaki gibi hesaplanır. 10 4E G R

2 2

2 2 2 2

10 4

(4 4) (5 4) (4 4) (3 4)0.5

4

i iE G E G R E G

Ri 6 10 14 18

2

i iE G E G R R 0.5 0.5 42.16

133.84

8. Risk veri iken hata terimini koşullu varyansını hesaplayalım.

Örneğin risk %10 iken hata teriminin koşullu varyansı aşağıdaki gibi hesaplanır.

10 0E u R

2 2

2 2 2 2

10 0

(0 0) (1 0) (0 0) ( 1 0)0.5

4

i iE u E u R E u

Ri 6 10 14 18

2

i iE u E u R R 0.5 0.5 42.16

133.84

Uygulama 7 ve Uygulama 8 ‘deki sonuçlardan görüleceği üzere her alt ana kütle için bağımlı

değişken getirinin koşullu varyansı ile hata teriminin varyansı eşittir.

57

9. “Regresyon analizi ……… ilişkisine dayandığı için, değişken seçiminde ……..

vardır” ifadesindeki boşluklara aşağıdakilerden hangisi gelecektir?

a) Nedensellik- asimetri

b) Doğrusallık-asimetri

c) Rassallık-simetri

d) Nedensellik- simetri

e) Rassallık-asimetri

10. Regresyon analizinin, korelasyon analizine benzerliği aşağıdakilerden hangisidir?

a) Her iki analizde de bağımlı ve bağımsız değişkenin yer alıyor olması

b) Her iki analizin de nedensellik ilişkisine dayanması

c) Her iki analizin de değişkenler arasında birlik ve beraberliği aramaları

d) Her iki analizin de kesin ilişkileri göstermesi

e) Her iki analizde de parametrelerin tahmin ediliyor olması

Cevaplar

9) a

10) c

58


Bu bölümde basit doğrusal model çerçevesinde ana kütle regresyon modelini ve örnek

regresyon modelini tanıttık. Doğrusal regresyon modelinde bağımlı değişken , rassal değişken

ve bağımsız değişken ile ilgili temel varsayımları verdik. Bağımlı değişkenin beklenen değeri

ve varyansının nasıl hesaplandığını gördük. Bağımlı değişkenin gözlemlenen değerleri (teorik

değerleri) ile bağımlı değişkenin beklenen değerlerini kullanarak rassal hataların değerlerini

hesapladık. Hata teriminin (rassal hatalar) beklenen değeri ve varyansının nasıl

hesaplanacağını öğrendik. Hata terimlerinin beklenen değerinin sıfır olduğunu, varyansının ise

bağımlı değişken Y’nin varyansına eşit olduğunu tespit ettik. Böylece bağımlı değişken ile

rassal hatanın aynı dağılıma sahip oldukları sadece ortalamalarının farklı olduğu sonucuna

ulaştık. Regresyon modelinde yer alan parametrelerin yorumlarını öğrendik. Hata teriminin

kaynaklarının neler olduğunu öğrendik.

59

Bölüm Soruları

1. “ Anakütle regresyon doğrusu ….. üzerinden, örnek kütle regresyon doğrusu …..

üzerinden geçer ” ifadesindeki boşluklara aşağıdakilerden hangisi gelecektir?

a) Bağımsız değişkenin değerleri ; bağımsız değişkenin değerleri

b) Bağımlı değişkenin koşullu ortalaması değerleri ; bağımlı değişkenin tahmini değerleri

c) Bağımlı değişkenin tahmini değerleri ; bağımlı değişkenin koşullu ortalama değerleri

d) Bağımlı değişkenin gözlemlenen değerleri ; bağımlı değişkenin koşullu ortalama değerleri

e) Bağımlı değişkenin koşullu ortalama değerleri ; bağımsız değişkenin gözlemlenen

değerleri

2. Bağımlı değişkenin gözlemlenen değeri, bağımlı değişkenin koşullu olasılığı, bağımlı

değişkenin beklenen değeri, bağımlı değişkenin tahminini ifade eden terimler sırasıyla

aşağıdakilerden hangiside doğru verilmiştir?

a) iY ; ( )iE Y X X ; ( )i iP Y Y X X ; îY

b) îY ; iY ; ( )iE Y X X ; ( )i iP Y Y X X

c) iY ; ( )i iP Y Y X X ; ( )iE Y X X ; îY

d) îY ; ( )iE Y X X ; ( )i iP Y Y X X ; iY

e) iY ; ( )i iP Y X X X ; ( )i iE Y X X X ; îY

3. Aşağıdaki gösterimlerden hangisi yanlıştır?

a) 1 2( )i iE Y X X X

b) 0 1 1 2 2ˆ ˆ ˆ î i iY X X

c) 0 1 1 2 2ˆ ˆ ˆ( )i i i iE Y X X X X u

d) 0 1ˆ ˆ ˆ

i i iY X u

e) ( )i i iY E Y X X u

4. Aşağıdaki ifadelerden hangisi yanlıştır?

a) Bağımlı değişken olasılık dağılımına sahiptir.

60

b) Bağımsız değişken tekrarlanan örneklerde farklı değer alabilir.

c) Hata terimi, bağımlı değişkenin gözlenen değeri ile bağımlı değişkenin beklenen değeri

arasındaki farka eşittir.

d) Kalıntı, bağımlı değişkenin gözlemlenen değeri ile bağımlı değişkenin tahmini değeri

arasındaki farka eşittir.

e) Regresyon modelinde eğim katsayısı marjinal değişmeyi gösterir.

5. “Hata terimi ……………….. iken, kalıntı………………….. arasındaki farka eşittir”

ifadesindeki boşluklara aşağıdakilerden hangisi gelecektir?

a) ( )i iY E Y X X ; î îY Y

b) î îY Y ; ( )i iY E Y X X

c) ( )i iE Y X X Y ; ˆî iY Y

d) îY Y ; ( )iE Y X X Y

e) ( )i iE Y X X X ; î iY X

6. Aşağıdakilerden hangisi örnek regresyon doğrusudur?

a) 0 1ˆ ˆ( )i iE Y X X X

b) 0 1î iY X

c) 0 1( )i iE Y X X X

d) ˆ ˆ( )i i iY E Y X X u

e) 0 1ˆ ˆ î iY X


a) Hata terimi ile bağımlı değişken aynı dağılıma sahiptir, ancak koşullu ortalamaları

farklıdır.

b) Hata teriminin koşullu ortalaması sıfır iken, bağımlı değişkenin koşullu ortalaması

0 1 iX ’ya eşittir.

c) Hata terimi ile bağımlı değişken rassal değişkenlerdir.

61

d) Bağımlı değişkenin değeri biliniyor iken, hata teriminin değerleri modelin çözümü

sonucunda hesaplanır.

e) Bağımlı değişken rassal iken, hata teriminin değeri gözlemler itibariyle sabittir.

8. Bağımlı değişken ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

a) Bağımlı değişken rassal bir değişkendir..

b) Bağımlı değişkenin olasılık dağılımı vardır, dolayısıyla koşullu ortalama ve koşulu

varyansı hesaplanabilir.

c) Bağımlı değişkenin olasılık dağılımı olduğu için koşullu olasılıkları hesaplanabilir.

d) Bağımlı değişkenin değeri her gözlem için sabittir..

e) Bağımlı değişkenin bileşenleri, sistematik ve stokastik unsurlardır.

9. 0 1( )i iE Y X X X modelinde yer alan 1 parametresi ile ilgili olarak

aşağıdakilerden hangisi yanlıştır.

a) 1 parametresi, X ’deki 1 birimlik değişme karşısında bağımlı değişkenin beklenen

değerindeki ( ( )iE Y X X ) değişmeyi gösterir.

b) 1 parametresi, ana kütle regresyon doğrusunun eğimine eşittir.

c) 1 parametresi, marjinal etkiyi ifade eder.

d) 1 parametresi, ana küte regreyon doğrusunun Y eksenini kestiği noktadaki değerine

eşittir.

e) 1 parametresi X değişkeni ile Y’nin beklenen değeri arasındaki ilişkiyi gösterir.

10. Hata terimi ile ilgili aşağıdaki ifadelerden hangisi yanlıştır?

a) Hata teriminin beklenen değeri sıfırdır ( ) 0iE u X X

b) Hata terimi rassal bir değişkendir.

c) Hata terimi olasılık dağılımı olan bir değişkendir.

d) Hata terimi Y nin gözlemlenen değerlerinin koşullu ortalamasıdır. .

e) Hata teriminin koşullu varyansı ile bağımlı değişkenin koşullu varyansı eşittir,

2 2

i i i i i iE Y E Y X X E u E u X X

62

Cevaplar

1) b

2) e

3) c

4) b

5) a

6) e

7) e

8) d

9) d

10) d

63

3. BASİT DOĞRUSAL REGRESYON MODELİ

64


3.1. Regresyon Parametrelerinin Tahmini

3.2. En Küçük Kareler Yaklaşımı

3.2.1. Basit Regresyon Modelinin Tahmini için En Küçük Kareler Yöntemi

3.2.2. En Küçük Kareler Yönteminin Sapmalar Kuralı ile Uygulaması

3.3. Açıklayıcı Örnek: Satış Gelirleri ile Reklam Harcamaları

3.4. En Küçük Kareler Yönteminin Özellikleri

3.5. Öngörü

65


1) Örnek verilerinden regresyon doğrusunun parametreleri nasıl tahmin edilir?

2) Aynı ana kütleden çekilen iki veya daha fazla örneğin örnek regresyon denklemleri

aynı mıdır?

3) Elde edilen tahminler nasıl yorumlanır?

4) Regresyon denklemi kullanılarak öngörüde bulunmak mümkün müdür?

66




En küçük kareler yöntemi Örnek regresyon

modelindeki parametrelerin

tahmin edilmesi

En Küçük Kareler

yönteminin uygulaması

özümsenmeli, ders

notlarında uygulamalı

sorular çözümlenmelidir

Farklı veriler uygulamalar

yapılarak bilgiler

pekiştirilmelidir

En küçük kareler yönteminin

normal denklemlere ve

sapmalar kuralına göre

uygulaması

Her iki yöntemin de aynı

sonucu verdiğinin görülmesi

Ders notlarındaki sorular iki

yönteme göre çözülmeli,

sonuçlar karşılaştırılmalıdır.

Farklı veriler uygulamalar

yapılarak bilgiler

pekiştirilmelidir

Öngörü Tahmin edilen regresyon

modelinin öngörü veya

geleceğin tahmin amacıyla

kullanılabileceğinin

anleşılması

Ders notları

En küçük kareler yönteminin

özellikleri

Analizlerin daha iyi

anlaşılabilmesi

Ders notları

67

Anahtar Kavramlar

En küçük kareler tahmincisi

En küçük kareler tahmini

BLUE tahmin

Kalıntı

Öngörü

68

Giriş

Regresyon analizinde amaç, örnek verilerinden ana kütle regresyon modeli için en

uygun tahmini elde etmektir. Bu amaç için başlangıç düzeyi için kullanılabilecek yöntemler

arasında En Küçük Kareler Yöntemi en fazla tercih edilenidir.

Bu bölümde En küçük kareler yöntemi tanıtılacak ve iki farklı uygulaması üzerinde

durulacaktır. Açıklayıcı örneklerin çözümü ile konunun pekiştirilmesi amaçlanmıştır. Tahmin

edilen parametrelerin iktisadi açıdan ne anlama geldiği ve doğru yorumlanması önem arz

etmektedir.

Regresyon analizinin hedeflerinden biri tahmin edilen regresyon modelinden bağımlı

değişken için öngörüde bulunmaktır. Bu bölümde öngörü üzerinde de kısaca durulacaktır.

Okuma metininde geçen ispatlar konuya ayrıca ilgi duyanlar için verilmiştir.

69

3.1. Regresyon Parametrelerinin Tahmini

İkinci bölümde ele alınan ana kütle regresyon modelinin parametrelerini tahmin etmek

için, örnek verisini kullanmak temeldir. Çünkü ana kütle ile ilgili verilerin sağlanması her

zaman mümkün olmayabilir. Ana kütle regresyon modelinde yer alan unsurlar ( Y ve X )

doğrudan gözlenemediği için, bağımlı değişken ile bağımsız değişken arasında ilişki kuran

0 1( )i iE Y X X X regresyon doğrusunun koordinat sisteminde yerinin belirlenmesi

sorundur. Bağımlı değişken ile bağımsız değişken arasındaki ortalama ilişkiyi gösteren ana

kütle regresyon doğrusunun tüm veri noktalarının ortasında bir yerde olacağı beklenmektedir.

Amacımız örnek verilerinden hareket ederek 0 1( )i iE Y X X X regresyon

doğrusunun tahmin edilmesidir. Bu amaç için, ana kütle parametreleri 0 ve 1 ’in tahmin

edilmesi gerekir. İkinci bölümde de ifade edildiği üzere 0 ve 1 ’in örnek verilerinden

tahminleri 0 ve 1 ile gösterilmektedir.

Örnek verileri kullanılarak 0 ve 1 ’in tahmin edilebilmesi için kullanılan başlıca

parametre tahmin yöntemleri:

Momentler yöntemi

En Çok Benzerlik (EÇB) yöntemi (Maksimum Olabilirlik yöntemi)

En Küçük Kareler (EKK) yöntemi’dir.

EKK yöntemi diğer tahmin yöntemleri ile karşılaştırıldığında, uygulaması daha basit

olduğu ve ekonometrik modelin lehine doyurucu sonuçlar verdiği için tercih edilmektedir.

Bundan dolayı En Çok Benzerlik Yöntemi dışındaki diğer tahmin yöntemleri bazı yönleri ile

EKK yönteminin düzeltilmiş şeklini içermektedir. Bu bölümde uygulamada en yaygın

kullanılan En Küçük Kareler (EKK) tahmin yöntemi ile basit doğrusal regresyon modelinin

tahmini detayları ile verilecektir.

3.2. En Küçük Kareler Yaklaşımı

3.2.1. Basit Regresyon Modelinin Tahmini İçin En Küçük Kareler

Yöntemi

Regresyon analizinde, örnek verileri temel alınarak ana kütle regresyon fonksiyonunu (

0 1( )i iE Y X X X ) mümkün olduğu kadar doğru tahmin etmek temel hedeftir.

En Küçük Kareler ilkesine göre veri değerlerine uygun doğru için, n tane iX ve iY

veriyken örnek regresyon fonksiyonundan elde edilen îY ’ler, gözlemlenen (teorik) iY ’lere

70

olabildiğince yakın olmalıdır. Bunun için kıstas, gözlemlenen iY ’ler ile tahmin edilen îY

arasındaki fark olarak tanımlanan kalıntı ( î i iu Y Y ) karelerinin toplamını minimize eden 0

ve 1 değerlerini bulunmasıdır. Pozitif uzaklıkların negatif uzaklıklarla ortadan kaldırılmasını

önlemek için, iY ile îY arasındaki dikey uzaklıkların ( îu ) karesi alınmaktadır.

Bu durumda her bir veri noktasından ( iY ) örnek regresyon doğrusuna ( 0 1ˆ ˆˆ

i iY X )

dikey uzaklıklar ( îu ) aşağıda verilmiştir.

0 1ˆ ˆˆ

i i i i iu Y Y Y X

Buradan kalıntıların karelerinin toplamı aşağıdaki gibi gösterilir.

2 2 2

0 1ˆ ˆˆˆ ( ) ( ) mini i i i iu Y Y Y X

Kalıntı kareler toplamının minimum (2ˆ miniu ) olması durumda, tahmin edilen 0

ve 1 parametreleri doğrusal, sapmasız (eğilimsiz) ve en iyi (tesirli, en küçük varyanslı) -

BLUE- tahminlerdir. Kalıntı kareler toplamını minimum yapma koşulu ise, kalıntı kareler

toplamı fonksiyonunda 0 ve 1 parametrelerine göre birinci dereceden kısmi türevlerin sıfıra

eşitlenmesi ile mümkündür. Kısaca,

2

0

ˆ0

îu

ve 2

1

ˆ0

îu

olarak ifade edebiliriz. Kalıntı kareler toplamı fonksiyonunda 0 ve 1 parametrelerine göre

kısmi türev alınır ve gerekli sadeleştirmeler yapılırsa aşağıdaki denklemler elde edilir.

0 1

2

0 1

ˆ ˆ

ˆ ˆ

i i

i i i i

Y n X

Y X X X

Yukarıdaki iki denklem birlikte bir denklem sistemini oluşturur ve normal denklemler

olarak adlandırılır. Burada n örneklem büyüklüğüdür.

71

İSPAT (Okuyucunun isteğine bağlı)

Normal Denklemlerin Elde Edilmesi

2 2

0 1

0 1

0 0

ˆ ˆˆ ( ) ˆ ˆ0 ( 2) ( ) 0ˆ ˆ

i i i

i i

u Y XY X

2 2

0 1

0 1

1 1

ˆ ˆˆ ( ) ˆ ˆ0 ( 2) ( )( ) 0ˆ ˆ

i i i

i i i

u Y XY X X

Eşitliklerin her iki yanı (-2)’ ye bölünür.

0 1

0 1

ˆ ˆ( 2) ( ) 0 ˆ ˆ( ) 0( 2) ( 2)

i i

i i

Y XY X

0 1

0 1

ˆ ˆ( 2) ( )( ) 0 ˆ ˆ( )( ) 0( 2) ( 2)

i i i

i i i

Y X XY X X

Toplama işlemcisi ( ), parantez içine dağıtılır ve sadeleştirmeler yapılırsa aşağıdaki

denklemler elde edilir. ( Not: ’nın sabit bir terim olan 0 ile çarpımından “n 0 ” elde edilir.)

0 1ˆ ˆ 0i iY n X

2

0 1ˆ ˆ 0i i i iY X X X

Bağımlı değişkeni içeren unsurlar eşitliğin sol tarafında bırakılarak,

0 1ˆ ˆ

i iY n X

2

0 1ˆ ˆ

i i i iY X X X

sonucuna ulaşılır.

Normal denklemler 0 ve 1 için Cramer yöntemi ile çözülürse;

2 2

0 2 2

2

ˆ( )

i i i i

i ii

i i

Y X

YX X Y X Y X X

n X Xn X

X X

72

1 2 2

2

ˆ( )

i

i i i i i i i

i ii

i i

n Y

X Y X n Y X X Y

n X Xn X

X X

eşitlikleri elde edilir. Normal denklemlerin çözümünden sağlanan bu eşitlikler, En Küçük

Kareler tahmincileridir. iX ve iY ’in örnek değerleri Cramer yöntemi ile elde edilen

denklemlere uygulanırsa, 0 ve 1 parametrelerinin En Küçük Kareler tahminleri elde edilir.

Ana kütleden çekilen örnek verileri örnekten örneğe değişeceği için, EKK tahminleri

de değişecektir. Bu durumda 0 ve 1 rassal değişkenlerdir.

EKK tahmincileri, genel formüller ve rassal değişkenlerdir.

EKK tahminleri, gözlemlenen verilere genel genel formüllerin uygulanması ile elde

edilen sayısal değerlerdir.

3.2.2. En Küçük Kareler Yönteminin Sapmalar Kuralı ile Uygulaması

EKK’in normal denklemlerinde iX ve iY ’ye ait örneklem değerlerinin sıfırdan

uzaklıkları kullanılmaktadır. Bu durumda orjin O(0;0) noktasıdır. Aritmetik ortalamanın

sağladığı kolaylıklardan yararlanılarak, EKK tahmincilerini daha basit biçimde formüle etmek

mümkündür. En küçük kareler tahmincilerinin iX ve iY ’in örnek değerlerinin örnek ortalama

değerlerinden ( X , Y ) farkları ile gösterimi EKK yönteminin diğer bir uygulama biçimi

sapmalar yöntemidir. Örnek değerlerinin örnek ortalama değerlerinden uzaklıklarının dikkate

alındığı söz konusu durumda orjin O ( X ; Y ) noktasıdır. En küçük karelerin sapmalar

yöntemine göre tahmincileri aşağıdaki gibidir.

1 22ˆ i ii i

i i

X X Y Yx y

x X X

0 1ˆ ˆY X

Burada iX X n ve iY Y n , Y ve X gözlemlerinin örnek ortalamalarıdır.

i ix X X , i iy Y Y ise, Y ve X gözlem değerlerinin örnek ortalamalarından farklarıdır.

Kısaca ix ve iy ortalamadan sapmadır. Sapmalar kuralına göre EKK yönteminin

uygulamasında öncelikle 1 , ikinci aşamada 0 ’ın hesaplanması gerekir.

73


EKK Tahmincilerinin EKK Sapmalar Yöntemine Göre Elde Edilmesi

1 için EKK tahmincisinin pay ve paydasını gözlem sayısı n’e bölünür.

1 22 2 2

ˆ( )

i i i i i i i i

i i i i

n Y X X Y n Y X X n Y n

n X X n X X n

İstatistik dersinden;

iX n X ve iY n Y olduğu bilinmektedir. Buna göre yukarıdaki denklemde

iX n yerine X ve iY n yerine Y yazılır ise aşağıdaki denklem elde edilecektir.

1 2 2ˆ i i

i

X Y nXY

X nX

Burada i i i iX Y nXY x y ve 2 2 2

i iX nX x eşitlikleri söz konusudur.

Sonuç olarak sapmalar yöntemine göre EKK tahmincisi aşağıdaki gibidir.

1 2ˆ i i

i

x y

x

2 2 2

i ix X nX eşitliğini aşağıdaki gibi gösterebiliriz. i ix X X eşitliği

bilindiğine göre;

22

i i i ix X X X X X X

2 2

i i iX XX XX X

Toplama işlemcisi parantez içine dağıtılır. Burada X bir sabit olduğu için nX ‘dır.

2 2 2

i i i ix X X X X X nX

2 22i iX X X nX

Yine iX n X eşitliğinden iX nX yazılabilir ve

74

2 2 22i ix X X nX nX

2 2 22iX nX nX

Buradan;

2 2 2

i ix X nX

eşitliğine ulaşılır. i i i ix y X Y nXY olduğunun ispatı okuyucuya bırakılmıştır.

En küçük kareler yönteminin sapmalar kuralına göre uygulamasında 1 ’den

sonra 0 tahmincisinin elde edilmesi için normal denklemlerden birincisi kullanılır ve

denklemin her iki yanı gözlem sayısı n’e bölünür.

0 1ˆ ˆ

iiY n X

0 1ˆ ˆ

i iY n Xn n

Buradan

0 1ˆ ˆY X

elde edilir. Eşitlik 0 için yeniden düzenlendiğinde

0 1ˆ ˆY X


EKK yönteminin her iki uygulamasında da 0 ve 1 için aynı sonuçlar elde edilecektir.

1 2ˆ i i

i

x y

x

eşitliğini aşağıdaki verildiği gibi göstermek mümkündür:

1 2 2 2ˆ i i i i i i

i i i

x y X y x Y

x x x

75


i i i ix y xY eşitliği aşağıdaki gibi gösterilir.

i iy Y Y eşitliği bilindiğine göre;

i i i ix y x Y Y yazılır ve ix parantez içine dağıtılır.

i i i i ix y xY Y x

Yine istatistik dersinin konusu aritmetik ortalamanın özelliklerinden

0i ix X X olduğu bilinmektedir. Buna göre;

0 0i i i i i ix y xY Y xY

olacak ve

i i i ix y xY

eşitliği elde edilecektir. i i i ix y y X olduğunun ispatı okuyucuya bırakılmıştır.


Aşağıda bir spor giyim mağazasının 5 aylık satış gelirleri ile reklam harcamalarına

ilişkin veriler yer almaktadır. Bu verileri kullanarak örnek regresyon denklemini ( 0 1ˆ ˆˆ

t tY X

) tahmin ediniz.

Aylar Satış Gelirleri

(1000 L)

Reklam Harcamaları

(1000 L)

1 3 1

2 4 2

3 2 3

4 6 4

5 8 5 Tablo 3.1. : Satış gelirleri ve reklam harcamaları

Örnek regresyonunun tahmin edilebilmesi için öncelikle bağımlı ve bağımsız

değişkenlerin belirlenmesi gerekir. Satışlar, reklam harcamalarının bir fonksiyonu olduğu diğer

bir ifade ile nedensellik reklam harcamalarından satışlara doğru olduğu için satışlar bağımlı

değişken reklam harcamaları bağımsız değişkendir.

Y= Satışlar (1000 lira)

76

X= Reklam harcamaları (1000 lira)

Satışlar( ) Reklam Harcamaları( )Y X

Örnek regresyon fonksiyonu, EKK yöntemiyle yukarıda anlatıldığı üzere

X ve Y’nin gözlemlenen (teorik) değerlerinden

veya

X ve Y ’nin gözlemlenen değerlerinin ( ,i iX Y ) kendi ortalamalarından ( ,X Y )

farklarından ( ,i ix y )

olmak üzere iki şekilde tahmin edilebilir.

Öncelikle X ve Y ’nin gözlem değerleri kullanılarak örnek regresyonu tahmin

edilecektir. Bu amaçla

0 1

2

0 1

ˆ ˆ

ˆ ˆ

ii

i i i i

Y n X

Y X X X

normal denklemlerdeki değişkenlerle ilgili unsurların (i

Y , iX , i iY X ,2

iX )

hesaplanması gerekecektir. Gözlem sayısı (n ) 5’e eşittir.

Y X X2 XY

3 1 1 3

4 2 4 8

2 3 9 6

6 4 16 24

8 5 25 40

iY =23

iX =15

2

iX 55 ii

Y X 81

Tablo-3 .2: Satışlar ve reklam harcamalarının ara sonuçları

Tablonun son satırı ara sonuçlar kullanılarak tahmin değerleri aşağıdaki gibi hesaplanır.

2 2

0 2 2 2

2

23.55 81.15ˆ 1.0( ) 5.55 (15)

i i i i

i i i

i i

Y X

YX X Y X Y X X

n X n X X

X X

ve

77

1 2 2 2 2

2

5.81 15.23ˆ 1.2( ) 5.55 (15)

i

i i i i i i i

i i i

i i

n Y

X Y X n Y X X Y

n X n X X

X X

EKK tahminleri 0ˆ 1.0 , 1

ˆ 1.2 ‘dir. Buna göre; Satışlar ile reklam harcamaları

arasındaki ortalama ilişkinin tahmini örnek regresyon fonksiyonu aşağıdaki gibidir.

ˆ 1.0 1.2i iY X

İkinci olarak EKK yönteminin diğer bir uygulama biçimi olan sapmalar yöntemiyle de

aynı sonuca ulaşmak mümkündür. Bu amaç için aşağıdaki denklemler kullanılacaktır.

1 0 12ˆ ˆ î i

i

x yY X

x

Öncelikle yine denklemlerde yer alan unsurların ( i ix y ,2

ix ,Y , X ) hesaplanması

gerekecektir. Bu amaç için Tablo 3.2 ’de elde edilen sonuçlar kullanılacaktır. Öncelikle X ve

Y ’nin hesaplanması gerekir.

15 23

3 4.65 5

X YX Y

n n

81 5.3.(4.6) 12i i i ix y X Y nXY

2 2 2 255 5.(3) 10i ix X nX

1 2

12ˆ 1.210

i i

i

x y

x

ve

0 2ˆ ˆ 4.6 (1.2).3 1.0Y X

olarak hesaplanır. Örnek regresyon fonksiyonu aşağıdaki gibidir.

ˆ 1.0 1.2i iY X

Görüldüğü üzere EKK yönteminin her iki uygulanmasının sonuçları aynıdır.

78

EKK tahminleri elde edildikten sonraki aşamada örnek regresyon doğrusunu koordinat

sistemi üzerinde gösterebiliriz. 2. Bölümde belirttiğimiz üzere örnek regresyon doğrusu bağımlı

değişkenin tahmini değerleri ( îY ) üzerinden geçer. Buna göre öncelikle ˆ

iY ’lerin hesaplanması

gerekir. iX ’in değerleri (1,2,3,4,5) ˆ 1.0 1.2i iY X denkleminde yerine konur ve hesaplamalar

yapılırsa îY ’ler elde edilecektir.

Örneğin 2 2X olduğu 2. gözlem için 2Y aşağıdaki gibi hesaplanır.

2 2ˆ 1.0 1.2 1.0 1.2 2 3.4Y X

İkinci gözlemde satışların gözlemlen değeri ( 2Y ) 4 iken, satışların tahmini ( 2Y ) 3.4’e

eşittir. Hesaplanan diğer sonuçlar aşağıdaki tabloda verilmiştir.

Y X X2 XY îY

3 1 1 3 2.2

4 2 4 8 3.4

2 3 9 6 4.6

6 4 16 24 5.8

8 5 25 40 7.0

iY =23

iX =15

2

iX 55 ii

Y X 81 î

Y =23

Bu aşamada her bir veri noktasından ( iY ) örnek regresyon doğrusuna ( 0 1ˆ ˆˆ

i iY X )

dikey uzaklıklar olan kalıntılar ( îu ) ve kalıntı kareler toplamı (2îu ) hesaplanacaktır.

0 1ˆ ˆˆˆ

i i i iu Y Y Y X

Örneğin 2. gözlem için kalıntı ( 2u ) aşağıdaki gibi hesaplanır.

2 2 2ˆˆ 4 3,4 0.6u Y Y

Hesaplanan diğer sonuçlar aşağıdaki tabloda verilmiştir.

Y X X2 XY ˆ

iY îu

î iY Y

2îu

3 1 1 3 2.2 0.8 (0.8)2

4 2 4 8 3.4 0.6 (0.6)2

2 3 9 6 4.6 -2.6 (-2.6)2

6 4 16 24 5.8 0.2 (0.2)2

8 5 25 40 7.0 1 (1)2

iY 23 i

X

15

2

iX

55

iiY X

81

î

Y

23

î

u

0

2îu

8.8

79

i=1,…,5’e kadar hesaplanan kalıntı kareler toplamının ( î

u ) sıfıra eşit olduğuna dikkat

ediniz. Kalıntı kareler toplamı sıfıra eşittir, ˆ 0i

u . Tablodan görüldüğü üzere kalıntı kareler

toplamı (2îu ) , 8.8’e eşittir,

2ˆ 8.8iu .

Şekil-3.1:Serpilme diyagramı, örnek regresyon doğrusu, kalıntılar

Yukarıdaki şekilde görüldüğü üzere EKK örnek regresyon doğrusu gözlemlenen

değerlerin arasından geçmektedir.

ˆ 1.0 1.2i iY X regresyon fonksiyonunu yorumlayalım. 0ˆ 1.0 sabit parametredir ve

geometrik açıdan regresyon doğrusunun dikey ekseni kestiği noktadır. Reklam harcamaları (X) sıfıra

eşit olduğu durumda satış gelirleri 1000 lira olacaktır. 1ˆ 1.2 eğim katsayısıdır. X değişkeni X

miktarı kadar değişirse, Y deki değişme 1.2Y X kadardır. Reklam harcamaları 1 birim (1000 lira)

artarsa satış gelirleri ortalama 1.2 birim (1200 lira) artacaktır.

80

3.4. En Küçük Kareler Yönteminin Özellikleri

En Küçük Kareler yönteminin özellikleri aşağıdaki gibi sıralanabilir.

1. En Küçük Kareler tahmin edicileri ( 0 ve 1 ) X ve Y değişkenlerin gözlenen değerleri ile

hesaplanabilir.

2. EKK tahmin edicileri nokta tahminlerdir. Örnek veriyken, örnekten tahmin edilen

parametre, ana kütledeki karşılığı için tek bir nokta tahmini verir.

3. Regresyon doğrusu ,A X Y noktasından geçer.

Şekil-3.2: Örneklem regresyon doğrusunun gösterimi

4. Bağımlı değişkenin tahmini değerlerinin ortalaması ( Y ), gözlemlenen değerlerinin

ortalamasına (Y ) eşittir,.

Y Y

81


Örnek regresyon fonksiyonu 0 1ˆ ˆˆ

i iY X de

0 yerine eşiti olan 0 1ˆ ˆY X yazılır.

1 1ˆ ˆˆ ( )iY Y X X = 1

ˆ ( )iY X X

i. gözlem için verilen bu eşitlik, i=1,2……n’e kadar tüm gözlemler için eşitliğin her iki

tarafının toplamı alındığında;

1 1ˆ ˆˆ [ ( )]i iY Y X X nY x


( ) 0i iX X x olduğundan

îY nY

ulaşılır.

Eşitliğin her iki taraf gözlem sayısı n ile bölünürse;

îY Y


Bu özellik modelde sabit parametre olduğu sürece geçerlidir.

5. Kalıntıların toplamı diğer bir ifade ile ortalaması sıfıra eşittir. Bu özellik de yine

modelde sabit parametre varsa geçerlidir.

ˆˆ ˆ0 , 0i i iu Y Y u

Bu özellik EKK yönteminin 2

iu ’nın minimum olması varsayımına dayanmaktadır.

îY nYn n

82


Kalıntıların karelerinin toplamı fonksiyonunda 1 ’e göre birinci mertebeden kısmi türevi

alınarak olduğu gösterilebilir:

2

i0 1

1

u ˆ ˆ2( )( 1) 0ˆ i iY X

Eşitliğin her iki tarafı (-2)’ye bölünür.

0 1ˆ ˆ

iY X

î iY Y

ˆ 0iu

Eşitliğin her iki yanı n’e bölündüğünde,

ˆ 0iu

n n ’den

ˆ 0u olacaktır.

Bu özellik ile örnek regresyon modeli, sadece gözlemlenen Xi ve Yi değerleriyle değil, X ve

Y’nin ortalama değerlerinden sapmaları biçiminde de yazılabilmektedir.


Bağımlı değişkenin gözlemlenen değerini 0 1ˆ ˆ ˆ

i i iY X u ile ifade etmiştik. Tek bir gözlem

için yazılmış bu denklem i=1,2……n için tüm gözlemler için yazılıp, her iki tarafın toplamı

alınırsa,

0 1ˆ ˆ ˆ

i i iY n X u

sonucuna ulaşılır. Burada ˆ 0iu olduğu için, denklem

0 1ˆ ˆ

i iY n X

ˆ 0iu

83

şekline indirgenir. Her iki taraf gözlem sayısı n’e bölünürse

( ,i iY n Y X n X eşitliklerinden)

0 1ˆ ˆY X

elde edelir. Sonraki aşamada iY Y oluşturulur.

0 1 0 1

1

1

ˆ ˆ ˆ ˆˆ( ) ( )

ˆ ˆ( )

ˆ ˆ

i i i

i i

i i i

Y Y X u X

X X u

y x u

elde edilir. Yeni elde edilen ana regresyon modelinde Xi veYi yerini kendi örneklem

ortalamalarından sapmalarına ( )i iy Y Y ve ( )i ix X X bırakmıştır. Bundan dolayı

regresyon modelinin sapmalı kalıbı olarak adlandırılır. Bu durumda örnek regresyon

modeli,

1ˆˆ

i iy x 0 1

ˆ ˆY X

ile gösterilir ve

ˆ î i iy y u ve ˆ ˆ

i i iu y y

eşitlikleri geçerlidir.

6. Kalıntılar ile bağımsız değişkenler arasında bir ilişki yoktur, ˆ 0i iu X .


Bu durum kalıntıların karelerinin toplamı fonksiyonunda 1 ’e göre birinci mertebeden

kısmi türev alınarak gösterilebilir.

2

i0 1

1

u ˆ ˆ2( )( ) 0ˆ i iY X X

0 1ˆ ˆ( ) ( ) 0i i iY X X

0 1ˆ ˆ( )i i iY X u eşit olduğu için

ˆ 0i iu X

84

7. Kalıntılar( îu ) ile bağımlı değişkenin tahmin edilen değerleri( Y ) arasında ilişki yoktur,

ˆ ˆ 0i iy u .


Bu özellik yukarıda elde edilen sapmalı kalıp yardımıyla açıklanabilir.

1ˆˆ ˆ ˆ

i i i iy u x u 1ˆˆ

i iy x

1 1ˆ ˆ( )i i ix y x

2 2

1 1ˆ ˆ

i i ix y x 1 2ˆ i i

i

x y

x

eşitliğinden

2

2

1 2ˆ i i

i i i

i

x yx y x

x

1 1ˆ ˆ 0i i i ix y x y

elde edilir.

3.5. Öngörü

Tahmin edilen regresyon denklemi, öngörü veya geleceği tahmin amaçları için de

kullanılabilir. Örneğin; haftalık geliri 35000 lira olan bir hane halkı için haftalık tüketim

harcaması öngörmek istersek, bu öngörüyü yapmak için X=350 (100 birim) tahmin

denkleminde yerine konulur.

ˆ 17.29 0.61 17.29 0.61(350) 386.4i iY X

Haftalık geliri 35000 lira bir hane halkının, haftalık tüketim harcamasının 386.4 lira

olacağını öngörebiliriz.

85

Uygulamalar

2. Bölümde 60 ailenin haftalık tüketim rakamları ve haftalık harcanabilir gelirlerine

ilişkin hipotetik verilerin yer aldığı ana kütleden “Örnek 1” ve “Örnek 2” olmak üzere iki örnek

çekildiğini hatırlayalım.

60 ailenin haftalık tüketim rakamları ile haftalık harcanabilir gelirler verilerinden

hesaplanan ana kütle regresyon denklemi aşağıdaki gibidir.

( | ) 17 0.6i iE Y X X

Örnek 1 ve Örnek 2 verileri aşağıda verilmiştir. Bu uygulamada her iki örnek verileri

için örnek regresyon fonksiyonu tahmin edilecektir. Not: İşlemlerle basitlik olması amacıyla

ara sonuçlar verilmiştir. Okuyucu verilen ara sonuçları Uygulama 1’de izlenen yolu

uygulayarak hesaplayabilir.

ÖRNEK 1 ÖRNEK 2

Y X Y X

65 80 55 80

80 100 74 100

79 120 90 120

113 140 103 140

125 160 107 160

115 180 135 180

144 200 144 200

157 220 160 220

155 240 189 240

178 260 150 260

Örnek 1 verileri için EKK tahminlerinin elde edilmesi

Örnek 1 için hesaplanan ara sonuçlar aşağıdaki gibidir.

n=10 1211Y 1700iX 2 322000iX 226020i iY X 170X

2 2

0 2 2

2

2

ˆ( )

(1211 322000) (226020 1700)17.29

(10 322000) (1700)

i i i i

i ii

i i

Y X

YX X Y X Y X X

n X Xn X

X X

86

1 2 2

2

2

ˆ( )

(10 226020) (1700 1211)0.61

(10 322000) (1700)

i

i i i i i i i

i ii

i i

n Y

X Y X n Y X X Y

n X Xn X

X X

ˆ 17.29 0.61i iY X

veya

1 2 2 2 2

226020 (10 170 121.1)ˆ 0.61322000 (10 170 )

i i i i

i i

x y X Y nXY

x X nX

0 1ˆ ˆ 121.1 (0.61).170 17.29Y X

ˆ 17.29 0.61i iY X

Beklenildiği üzere En Küçük Kareler yönteminin her iki uygulama biçimi de aynı

sonucu vermiştir.

Örnek 2 verileri için EKK tahminlerinin elde edilmesi

Örnek 2 için hesaplanan ara sonuçlar aşağıdaki gibidir.

n=10 1207Y 1700iX 2 322000iX 226800i iY X 170X 120.7Y

2 2

0 2 2

2

2

ˆ( )

(1207 322000) (226800 1700)9.37

(10 322000) (1700)

i i i i

i ii

i i

Y X

YX X Y X Y X X

n X Xn X

X X

87

1 2 2 2

2

2

ˆ( )

(10 226800) (1700 1207)0.65

(10 322000) (1700)

i

i i i i i i i

i ii

i i

n Y

X Y X n Y X X Y

n X Xn X

X X

ˆ 9.37 0.65i iY X

veya

1 2 2 2 2

226800 (10 170 120.7)ˆ 0.65322000 (10 170 )

i i i i

i i

x y X Y nXY

x X nX

0 1ˆ ˆ 120.7 (0.65).170 9.37Y X

ˆ 9.37 0.65i iY X

Böylece aynı ana kütleden çekilen iki farklı örneğe ait örnek regresyon fonksiyonların

ve regresyon doğrularının farklı olduğu görülmüştür.

En küçük kareler tahminleri, incelenen iktisadi model bağlamında yorumlanır. Haftalık

harcanabilir gelir ile tüketim harcamaları arasındaki ilişkinin araştırıldığı Uygulama 2’de Örnek

1 verilerinden tahmin edilen regresyon doğrusuna ( ˆ 17.29 0.61i iY X ) göre 1ˆ 0.65 değeri,

1 ’nin tahminidir. 2. Bölümden anımsarsak, haftalık harcanabilir gelir 100 lira birimi cinsinden

ölçülmektedir. Matematiksel olarak regresyon doğrusunun eğimini veren 1 , haftalık

harcanabilir gelir 100 lira arttığında, haftalık beklenen tüketim harcamasının artış miktarıdır.

Böylece haftalık gelir 100 lira arttığında, haftalık gıda harcaması 0.61 lira artacağını tahmin

edebiliriz. Tüketim modelinde, gelirdeki 1 birimlik değişmenin tüketimi ne kadar

değiştireceğini gösteren 1 parametresi marjinal tüketim meyli’ni verir. Böylece 1

ˆ 0.65

değeri iktisadi açıdan, örnek 1 verilerden ana kütle marjinal tüketim meylinin tahminini verir.

(Not: Ana kütle marjinal tüketim meyli Örnek 2 verilerinden 0.65 tahmin edilmiştir. )

Regresyon doğrusunun Y eksenini kesim noktası sabit parametre, 0ˆ 17.29 , sıfır gelire

sahip bir hane halkı için haftalık gıda harcamasının tahminidir. Tahmin edilen modele gör sıfır

gelire sahip bir hane halkının haftalık 17.29 lira harcama yapacağını ortaya koymasına karşın,

bu tahmini her zaman kullanmak mümkün değildir. Bölüm 2’de de belirtildiği üzere 0 ’ın bu

yorumu X’in 0 etrafında veri bulmasına bağlıdır ki; biz Örnek 1’de X=0 ‘a yakın herhangi bir

veri noktasına sahip değiliz.

88

Uygulama Soruları

1-5 arasındaki sorular aşağıdaki tablo kullanılarak cevaplandırılacaktır.

X Y

x

X X

2

2

x

X X

y

Y Y

i i

i i

x y

X X Y Y

3 5

2 2

1 3

-1 2

0 -2

X Y x 2x y i i i ix y X X Y Y

1. Tablodaki boşlukları doldurun.

X Y

x

X X

2

2

x

X X

y

Y Y

i i

i i

x y

X X Y Y

3 5 2 4 3 6

2 2 1 1 0 0

1 3 0 0 1 0

-1 2 -2 4 0 0

0 -2 -1 1 -4 4

X 5

Y 10

x 0 2x 10 y 0 i i i ix y X X Y Y 10

n=5 , 5

15

XX

n

, 10

25

YY

n

2. Sapmalar yöntemini ile 0 ve 1 ’in En Küçük Kareler tahminleri hesaplayarak,

yorumlayınız.

1 2

10ˆ 110

i i

i

x y

x

0 1ˆ ˆ 2 1.1 1Y X

Örnek regresyon denklemi

ˆ 1 1i iY X

Yorum: 1ˆ 1 ; X 1 birim arttığında, Y ’de beklenen artış miktarı 1 birimdir.

0ˆ 1 ; X=0 olduğunda Y , 1 birime eşittir. (Not: X sıfır etrafında değer aldığı için bu

yorumu yapabiliriz.

89

3. 2

ix ve i ix y değerlerinin,

2 2 2

i iX X X nX

ve

i i i iX X Y Y X Y nXY değerlerine eşit olduğunu gösteriniz.

Yukarıda hesaplanmış verilerin olduğu tablodan,

22 10i ix X X olduğu bilinmektedir. Bu aşamada

2 2

iX nX ’in

değerini hesaplamalıyız. 2 2

iX nX da yer alan unsurlardan n=5, 1X olup, 2

iX

bilinmemektedir. Öncelikle verilen X değerlerinden 2

iX ’lerin hesaplanması ve toplamının

alınması gerekir. Buna göre;

X X2

3 9

2 4

1 1

-1 1

0 0

X 5 2

iX =15

Böylece;

2 2 215 5(1) 10iX nX ‘dur

22 10i ix X X =

2 2 10iX nX

Eşitliği gösterilmiştir. Benzer olarak i i i iX X Y Y X Y nXY eşitliğini

aşağıdaki gibi göstermek mümkündür.

Tablodan 10i i i ix y X X Y Y olduğu bilinmektedir. i iX Y nXY ’da

yer alan unsurlardan n=5, 1X , 2Y olup, i iX Y ’nin hesaplanması gerekir.

90

X Y XY

3 5 15

2 2 4

1 3 3

-1 2 -2

0 -2 0

X 5 Y 10 XY 20

Böylece;

20 5.1.2 10i iX Y nXY ’dur.

10i i i ix y X X Y Y = 10i iX Y nXY

4. Soru 2’ deki EKK tahminlerinden bağımlı değişkenin tahmini ( Y )değerlerini

hesaplarak aşağıdaki tablodaki boşlukları doldurun.

îY değerlerinin hesaplanabilmesi için iX ’in değerleri ( 3, 2, 1, -1, 0) sırasıyla

ˆ 1 1i iY X regresyon denkleminde yerine konur ve îY ’ler hesaplanır. Buna göre ˆ

iY ’ler;

1ˆ 1 1.3 4Y

2ˆ 1 1.2 3Y

3ˆ 1 1.1 2Y

4ˆ 1 1.( 1) 0Y

5ˆ 1 1.0 1Y olarak hesaplanır. ˆ

iY ’ler hesaplandığına göre kalıntılarda î i iu Y Y

denklemi ile hesaplanabilir. Örneğin 1. Gözlem için 1 1 1ˆˆ 5 4 1u Y Y .

X Y îY ˆ

iu 2îu ˆ

i iX u

3 5

2 2

1 3

-1 2

0 -2

X 5 Y 10 îY ˆ

iu 2îu ˆ

i iX u

91

Lütfen dikkat ediniz:

ˆ 0iu

ˆ 0iY Y dolayısıyla ˆ 2Y Y olacaktır Bağımlı değişkenin

ortalaması bağımlı değişkenin tahmininin ortalamasına eşittir. Yine de Y hesaplamak

istersek ˆ 10ˆ 2

5

iYY

n

.

5. Regresyon doğrusu ve hata terimleri grafiği,

X Y îY ˆ

iu 2îu

3 5 4 1 1

2 2 3 -1 1

1 3 2 1 1

-1 2 0 2 4

0 -2 1 -3 9

X 5 Y 10 îY 10 ˆ

iu 0 2îu 16

92

6-8 arasındaki sorular aşağıdaki tablo kullanılarak cevaplandırılacaktır.

Xi

(1000 ton )

Yi

(100 lira)

1 4

2 6

3 7

4 7

5 9

6 11

6. Regresyon denklemini ( 0 1ˆ ˆˆ

i iY X ) tahmin ederek, sonuçları yorumlayınız.

Öncelikle EKK tahmincileri;

2 2

0 2 2

2

ˆ( )

i i i i

i ii

i i

Y X

YX X Y X Y X X

n X Xn X

X X

1 2 2

2

ˆ( )

i

i i i i i i i

i ii

i i

n Y

X Y X n Y X X Y

n X Xn X

X X

‘deki unsurların hesaplanması gerekir. Gözlem sayısı (n) 6’dır.

Xi

(1000 ton )

Yi

(100 lira)

2

iX i iX Y

1 4 1 4

2 6 4 12

3 7 9 21

4 7 16 28

5 9 25 45

6 11 36 66

21iX 44iY 2 91iX 176i iX Y

2

0 22 2

44 91 176 21ˆ 2.93( ) 6 91 21

i i i i i

i i

Y X Y X X

n X X

1 22 2

6 176 21 44ˆ 1.26( ) 6 91 21

i i i i

i i

n Y X X Y

n X X

ˆ 2.93 1.26i iY X Örnek regresyon denklemi

93

Yorum; X, 1000 ton artığında Y’ de beklenen artış miktarı 126 liradır. X’in dışındaki

faktörlerin Y ‘deki etkisi 293 liradır. (Not: X sıfır etrafında değer almadığı için yorum önceki

uygulamadan farklıdır.)

7. EKK tahminlerini kullanarak, EKK kalıntılarını ( îu ) hesaplayınız.

Kalıntıların ( î i iu Y Y ) hesaplanabilmesi için öncelikle ˆ

iY değerlerinin bilinmesi

gerekir. îY değerlerinin hesaplanabilmesi için iX ’in değerleri ( 1,2,3,4,5,6) sırasıyla

ˆ 2.93 1.26i iY X regresyon denkleminde yerine konur ve îY ’ler hesaplanır. Buna göre örneğin

1. Gözlem için

ˆ 2.93 1.26 2.93 1.26 1 4.19i iY X

Yi

(100 lira) îY ˆ

iu 2îu

4 4.19 -0.19 0.0361

6 5.45 0.55 0.3025

7 6.71

0.29 0.0841

7 7.97 -0.97 0.9409

9 9.23 -0.23 0.0529

9 10.49 0.51 0.2601

44iY 44iY ˆ 0.04iu **** 2ˆ 1.6766iu

****Kalıntıların toplamı ( îu ) sıfır olmalıdır. Burada ( 0.04 )olmasının nedeni 0

2.93333… olduğu halde yaklaşık 0 2.93 alınmış olmasıdır.

8. iX X ve 12iX için Y’nin öngörü değerleri nedir.

iX X için, öncelikle X ’nın hesaplanması gerekir.

21

3.56

XX

n

ˆ 2.93 1.26 2.93 1.26(3.5) 7.34i iY X

12iX için

ˆ 2.93 1.26 2.93 1.26(12) 18.05i iY X

94

9. 12 gözlem için veriler kullanılarak aşağıdaki ara sonuçlar hesaplanmıştır.

EKK yöntemini kullanarak örnek regresyon modelini oluşturunuz.

480iY , 36iX , 440i ix y , 2 20ix

Yukarıdaki veriler göre öncelikle EKK yönteminin hangi uygulama biçimini

kullanacağınızı doğru tespit etmeniz gerekir. Yukarıdaki verileri kullanarak normal denklemler

aracılıyla modeli tahmin edemezsiniz. Çünkü normal denklemlerin unsurlarından i iX Y ,

2

iX verilmemiş. Ancak EKK’in ortalamadan sapmalara göre uygulaması ile parametreleri

tahmin etmeniz mümkün. Şöyle ki;

Önce örnek regresyon modelini yazalım.

0 1ˆ ˆˆ

i iY X

EKK yönteminin sapmalar kuralına göre uygulamasında önce 1 ’in tahmin edilmesi gerekir.

1 ’in EKK tahmincisi aşağıdaki gibidir.

1 2ˆ i i

i

x y

x

440i ix y ve 2 20ix verildiğine göre

1 2

440ˆ 2220

i i

i

x y

x

Bu aşamada aşağıdaki EKK tahmincisi ile 0 ' ı tahmin etmemiz gerekir.

0 1ˆ ˆY X

Burada 1ˆ 22 olduğu bilinmekte, ancak Y ve X bilinmemektedir. Ancak yukarıdaki

verilerden hesaplanabilir. Gözlem sayısı 12 olduğuna göre Y ve X aşağıdaki gibi hesaplanır.

48040

12

iYY

n

ve 36

312

iXX

n

Böylece;

0 1ˆ ˆ 40 ( 22 3) 106Y X

Örnek regresyon fonksiyonu;

ˆ 106 22i iY X

X, 1 birim artarsa Y 22 birim azalacaktır, X’in dışındaki diğer faktörlerin Y üzerindeki etkisi

ortalama 106 birimdir. Veya X=0 olduğunda Y 106 birim olacaktır (Bu yorum X’in 0 etrafında

veri bulmasına bağlıdır, ancak bize gözlemlenen (teorik) veriler verilmemiş, sadece ara

sonuçlar verilmiştir.)

95

10. Aşağıda tahmin edilmiş tasarruf fonksiyonunu kullanarak marjinal tüketim

meylini (MCM) hesaplayın.

ˆ 1.2 0.2t tS Y S=Tasarruf, Y= Gelir

Yukarıdaki tasarruf modelinde 0.2 marjinal etkiyi göstermekte ve gelir 1 birim arttığında

tasarrufların 0.2 birim artacağını ifade etmektedir. Burada 0.2 marjinal tasarruf meylidir

(MSM). İktisat derslerimizden,

MCM+MSM=1

olduğunu bildiğimize göre marjinal tüketim meyli (MCM) 0.8’e eşittir.

96


Bu bölümde küçük kareler yaklaşımının her iki uygulama yöntemine göre ana kütle

parametrelerinin nasıl tahmin edileceğini öğrendik. Kalıntıların nasıl hesaplandığını ve ana

kütle hata teriminin tahmini olan kalıntıların da toplamının sıfır olduğunu gördük. En küçük

kareler regresyon doğrusunun nasıl çizileceğini, diğer bir ifade ile EKK regresyonunun cebrini

öğrendik. Tahmin edilen parametrelerin nasıl yorumlandığını gördük. Örnek regresyon

fonksiyonunu kullanarak bağımsız değişkenin verilen bir değeri için bağımlı değişkenin

değerini öngördük. En küçük kareler yönteminin özelliklerini öğrendik ki; bu özellikleri ileriki

derslerimizde kullanacağız. BLUE tahminin ne anlama geldiğini öğrendik. Tahminci ile tahmin

arasındaki fark üzerinde durduk.

97

Bölüm Soruları

1-7 arası sorular için aşağıdaki tablo kullanılacaktır.

Gözlem Y X

1 2 1

2 3 5

3 4 4

4 6 10

5 10 20

6 20 50

1. X , Y’nin nedeni olduğu bilgisine sahip olduğunuz varsayımı altında örnek

regresyon fonksiyonunun oluşturunuz.

a) ˆ 5.37 2.72i iY X

b) ˆ 0.47 1.02i iY X

c) ˆ 5.37 2.72i iX Y

d) ˆ 2.02 0.37i iY X

e) ˆ 2.37 1.22i iX Y

2. X’in birimi 100 lira Y’in birimi 10 ton ise modelin yorumu hangisidir?

a) X ’deki 1 brimlik artış Y’yi 2.37 ton arttırır.

b) X ’deki 100 liralık artış Y’yi 1.02 brim arttırır.

c) X ’deki 100 liralık artış Y’yi 27.2 ton arttırır.

d) X ’deki 100 liralık artış Y’yi 3.7 ton arttırır.

e) X ’deki 1birimlik artış Y’yi 1.22 birim arttırır.

3. Kalıntıların karelerinin toplamı nedir?

a)1.78

b)3.08

c) 40.9

d) 31.09

e) 13.21

4. i ix y =? ( i ix X X , i iy Y Y )

a) 0

b)1280

c) 820

d)139

e) 618

98

5. 2 ?ix ( i ix X X )

a) 227.5

b) 57.8

c) 43.9

d) 0

e) 90

6. 2 ?iy ( i iy Y Y )

a) 45

b) 27

c) 0

d) 1692

e) 23.5

7. Kalıntıların toplamı kaçtır?

a) Hesaplanamaz

b) 1

c) 8.8

d) 0

e) 12.6

8. 0 1ˆ ˆˆ

i iY X modeli için aşağıdakilerden hangisi 1 ’in bir tahmincisi

değildir?

a) 2

1ˆ

i i ix y x

b) 2

1ˆ

i i ixY x

c) 2

1ˆ

i i iX Y X

d) 2

1ˆ

i i iX y x

e) 1 2 2ˆ

( )

i i i i

i i

n Y X X Y

n X X


a) Bağımlı değişkenin gözlemlenen değerlerinin ortalaması, Bağımlı değişkenin tahmini

değerlerinin ortalamasına eşittir.

b) En küçük kareler yöntemi normallik varsayımına dayanmaktadır.

c) Örnek regresyon doğrusu ( X ,Y ) noktasından geçer.

d) Kalıntıları ortalaması sıfırdır.

e) En küçük kareler yöntemi kalıntılar kareler toplamının minimum olmasına

dayanmaktadır.

10. Aşağıdakilerden hangisi yanlıştır?

99

a) EKK tahmincilerini elde etmek için kalıntı kareler toplamının fonksiyonu sıfıra

eşitlenir ve tahmin edilecek parametrelere göre türev alınır.

b) Kalıntılar ile X bağımsız değişkeninin çarpımlarının toplamı sıfırdır, bu ana kütlede

hata terimleri ile X bağımsız değişkeninin ilişkisiz olduğu varsayımına denktir.

c) 0 1ˆ ˆY X ’in kullanımı örnek regresyon doğrusunun ( X ,Y ) doğrusundan geçtiği

varsayımına dayanır.

d) EKK yöntemini uygulayabilmemiz için bağımlı değişkenin dağılımı hakkında bilgi

sahibi olmamız gerekir.

e) EKK yöntemini sıfır ve ortalamalar orijinine göre uygulamasının sonuçları aynıdır.

Cevaplar

1) d

2) d

3) a

4) e

5) a

6) d

7) d

8) c

9) b

10) d

100

4. EN KÜÇÜK KARELER

TAHMİNCİLERİNİNDEĞERLENDİRİLMESİ

101


4.1. En Küçük Kareler Tahmincilerinin Değerlendirilmesi

4.2. En Küçük Kareler Tahmincilerinin Varyans ve Kovaryansları

4.3. Hata Teriminin Varyansının Tahmini

4.4. Uygulama: Satış Gelirleri ile Reklam Harcamaları

4.5. Esneklikler

4.6 Uygulama: Satış Gelirleri ile Reklam Harcamaları

102


1) Örnek verilerinden tahmin ettiğimz parametrelere güvenebiliriz miyiz?

2) Bunun için bir ölçü var mıdır?

3) Ekonometrik modelin sonuçlarından esneklik hesaplanabilir mi? Sonuçları nasıl

yorumlanır?

103




Tahmin edilen

parametrelerin Varyans

kovaryanslarının

hesaplanması

Tahmin edilen

paremetrelerinin

güvenirliliğini kavramak

Ders notları ve uygulamaların

tekrar edilmesi

Tahmin edilen bir

modelden ortalama

esneklik ve nokta

esnekliği

hesaplayabilmek ve

yorumlamak

İktisatta derslerinde de

üzerinde durulan talebin gelir

esnekliği, talebin fiyat

esnekliği gibi ölçülerin

ekonometrik modelden

hesaplamak ve yorumlamak

Ders notları ve uygulamaların

tekrar edilmesi

104

Anahtar Kavramlar

Varyans

Kovaryans

Hata teriinin varyansı

Ortalama esneklik

Nokta esneklik

105

Giriş

Basit regresyon modelinde parametrelerin EKK yöntemi ile nasıl tahmin edildiğini

öğrendik. Bu alt bölümden itibaren tahmin ettiğimiz bu parametrelere güvenebilir miyiz?

sorusunun cevabını arayacağız. Bu bağlamda tahmin edilen parametrelerin standart hataları

parametrenin güvenirliliği konusunda bir ölçü oluşturmaktadır. Ekonometrik analizin nihai

hedefleri olan hipotez testi ve aralık tahminleri için tahmin edilen parametrenin standart

hatasının bilinmesi gerekir. Bu bölümde tahmin edilen parametrelerin varyans ve

kovaryanslarının nasıl hesaplanacağı üzerinde durulacaktır.

Ayrıca tahmin edilen regresyon modeli sonuçlarına dayanarak nokta ve ortalamaya

göre esneklikler hesaplanacak ve yorumlanacaktır.

106

4.1. En Küçük Kareler Tahmincilerinin Değerlendirilmesi

2. Bölümde 60 ailenin harcanabilir gelir ve tüketim harcamalarının yer aldığı ana kütleyi

tanıtmış, 3. Bölüm Uygulamada bu ana kütleden çekilen iki örnek verileri kullanılarak,

0 1i i iY X u regresyon modeli için iki ayrı parametre tahminleri elde etmiştik. Elde

edilen sonuçlara göre, 0 ve 1 ’in EKK tahminlerinin ( 0 ve 1 ) örnekten örneğe değiştiği

görülmüştür (Hatırlatma; Örnek 1 için ˆ 17.29 0.61i iY X , Örnek 2 için ˆ 9.37 0.65i iY X ).

“Bu tahminlerin hangisi daha iyi?” sorusunu sormak doğaldır ancak bu soru cevaplanamaz.

Çünkü ana kütle parametreleri 0 ve 1 ’in gerçek değerleri bilinemediği için 0 ve 1

parametrelerinin gerçek ana kütle değerlerine ne kadar yakın olduğunu söylemek olanaksızdır.

Örnek 1 ve Örnek 2 ’deki gibi aynı gelir gruplarına sahip hane halklarını seçilmiş bile,

farklı bir ( 0 ve 1 ) tahminleri elde edilmesi örnekleme değişkenliği’nden kaynaklanmakta

olup, bu örnekleme değişkenliği kaçınılmazdır. Bir tahmincinin örnekleme doğruluğunu ve

güvenilebilirliğini değerlendirmek açısından örnekleme değişkenliğini anlamak önem arz eder.

Hane halkı tüketim harcamaları, Yi, i=1,....,60 rassal değişkenler olduğu için, farklı örnekler

farklı tahminler verecektir. Sonuç olarak, bir tahmin süreci olarak düşündüğümüzde ( 0 ve 1

) ’de rassal değişkenlerdir, çünkü değerleri Y rassal değişkenine bağlıdır. Bu bağlamda 0 ve

1 EKK tahmincileri olarak isimlendirilir. En küçük kareler tahmincileri 0 ve 1 rassal

değişkenler ise, bu durumda, bunların beklenen değerleri, varyansları, kovaryansları ve olasılık

dağılımları ( 0 ve 1 ) tahmincilerinin örnekleme özellikleri ile ilgilidir.


Bir tahmincinin varyansı, tahminlerin örnekten örneğe ne kadar değiştiğini kısaca

tahmincinin doğruluğunu ölçer. Bir tahmincinin daha küçük varyansı, o tahmincinin daha fazla

örnekleme doğruluğu anlamına gelmektedir. Bir tahmincinin örnekleme varyansı, diğer

tahmincininkinden daha küçükse, diğer tahminciden daha iyidir (doğrudur, tesirlidir) .

Basit regresyon modeli varsayımları 1-5 varsayımları 0 ve 1 ’nin varyans ve

kovaryansları aşağıdaki gibidir:

2

2

0 2ˆ( )

i

i

XVar

n x

2

1 2ˆ( )

i

Varx

107

2

0 1 2ˆ ˆ( , )

i

XCov

x

Yukarıda verilen varyans ve kovaryansı tahmincilerini etkileyen faktörleri aşağıdaki

gibidir.

Rassal hata terimi 2 , varyans ve kovaryans denklemlerinin her birinde yer almaktadır.

Rassal hata terimi gözlemlen Y değerlerinin beklenen değerleri

( ) i iE Y E Y X X E Y X etrafında yayılımını yansıtmaktadır. Daha büyük varyans

2 , daha fazla yayılım anlamına gelmektedir. Y değerlerinin ortalamalarına ( )E Y göre uzağa

düştüğü durum belirsizliğin daha fazla olması anlamına gelmektedir. 2 nin daha büyük olduğu

zaman,0 ve

1 hakkında sahip olduğumuz bilginin doğruluğu daha azdır. İstatistikte varyans

belirsizlik ölçüsü olduğu için, daha büyük varyans ( 2 ) en küçük kareler varyans ve

kovaryanslarının da daha büyük olması anlamına gelmektedir.

X değerlerinin ortalamaları etrafındaki kareleri toplamı2 2( )i ix X X

yukardaki varyans ve kovaryans denklemlerinin her birinde yer almaktadır. Bu ifade, bağımsız

veya açıklayıcı değişken X’in örnek değerlerinin, ortalamaları etrafında nasıl yayıldığını ölçer.

Bunlar, daha geniş yayıldıkça, daha büyük kareler toplamı ortaya çıkar. Aynı şekilde, bunlar,

daha dar bantta yayıldıkça, daha küçük kareler toplamı ortaya çıkar. Daha büyük kareler

toplamı 2

ix , en küçük kareler tahmincilerinin daha küçük varyansı anlamına gelip,

bilinmeyen parametreleri daha doğru bir şekilde tahmin edebiliriz. Bu durumda X değerleri, X-

ekseni boyunca genişçe yayılım göstermektedir. 2

ix verisi küçük ise veri belli bir noktada

“toplanmış”tır.

Daha büyük örnek büyüklüğü n, daha küçük EKK tahmincileri varyans ve

kovaryansları anlamına gelir. Daha büyük örnek verisi, daha küçük örnek verisinden daha

iyidir. Örnek büyüklüğü n yukardaki varyans ve kovaryans denklemlerinin her birinde yer

almaktadır, çünkü toplamların her biri, n terimden oluşmaktadır. Ayrıca n, 0( )Var ’da açıkca

görülmektedir.,n arttıkça kareler toplamı terimi (2

ix ) daha büyür çünkü, toplamdaki her bir

terim pozitif veya sıfırdır ( X’in bir gözlem değeri, örnek ortalamasına eşit olursa, toplam sıfır

ortaya çıkar, 2 2( ) 0i ix X X . Sonuç olarak, n daha büyük oldukça, hem 0( )Var hem

de 0 1( , )Cov daha küçük olur, kareler toplamı, paydalarında yer almaktadır. 0( )Var ın pay

ve paydasındaki toplamların her ikisi de n büyüdükçe, artarlar ve birisindeki artış diğeri

tarafından dengelenir, ancak belirleyici terim olarak paydadaki n denklemde yerini konulunca

ve n daha büyüdükçe, 0( )Var daha da küçüleceği kesindir.

108

2

iX terimi 0( )Var ’da yer almaktadır. Bu terim büyüdükçe, en küçük kareler

tahmincisi 0 ’ın varyansı büyür. Çünkü sabit parametre 0 , X=0 iken Y’nin beklenen

değeridir, 00E Y X . X=0’dan daha uzağa verilerimiz düşerse, tüketim harcaması

örneğinde olduğu gibi, 0 ’ı yorumlamak daha zor olacaktır ve 0 ’ı doğru bir şekilde tahmin

etmek de daha zor olacaktır. 2

iX terimi, X’in orjinden (X=0) olan kareli uzaklığı ölçer. X

değerleri, sıfıra yaklaşırsa, bu durumda, 2

iX daha küçük olacak ve bu 0( )Var ’ı

azaltacaktır. Fakat pozitif veya negatif, X değerleri büyük olursa, diğer şartlar sabitken, 2

iXdaha büyük olacak ve bu 0( )Var ’ı daha büyük olacaktır.

X-değerlerinin örnek ortalaması, 0 1( , )Cov ’de yer almaktadır. Kovaryansın mutlak

büyüklüğü, örnek ortalaması X ’ın büyüklüğündeki artışla artış gösterir ve kovaryans X ’ın

işaretinin tersi bir işarete sahiptir. Bunun sebebi, EKK regresyon doğrusunun X ve Y’nin

ortalama noktalarından geçmek zorunda olmasıdır.

Yukarıda verilen varyans ve kovaryans formüllerinde yer alan ana kütle hata teriminin

Varyansı ( 2 ) bilinmemekte, örnek verilerinden tahmin ( 2 ) edilmektedir. Varyans ve

kovaryans ormüllerinde bu tahmin değeri anakütle hata teriminin varyansı yerine konmaktadır.

Tahmin edilen varyansların kare kökleri, 0 ve 1 ’in “standart hataları”dır. Bu

sayılar, hipotez testi ve aralık tahmininde kullanılır. Bu standart hatalara aşağıda görüldüğü

gibi, 0ˆ( )Se ve 0

ˆ( )Se olarak gösterilir.

0 0ˆ ˆ( ) ( )Se Var

1 1ˆ ˆ( ) ( )Se Var

0 ve 1 ’in standart hataları, EKK tahminleri 0 ve 1 ’in örnekleme değişkenliğinin

ölçümleridir. Daha önce gösterildiği gibi, farklı veri örnekleri topladığımızda, parametre

tahminleri örnekten örneğe değişir. 0 ve 1 ’in tahmincileri, örnek verileri nasıl oluşursa

oluşsun kullanılan genel formüllerdir. Yani tahminciler, rassal değişkenlerdir. Bu sebeple,

olasılık dağılımlarına, ortalamalara ve varyanslara sahiptirler. Özellikle, hata terimlerinin

normal dağıldığı varsayımı sağlanırsa diğer bir ifade ile rassal hata terimleri iu normal

dağılırsa, bu durumda0 ve 1 aşağıdaki gibi normal dağılacaktır.

109

2 2

0 0 0 2ˆ ˆ, ( )

i

i

XN Var

n x

2

1 1 1 2ˆ ˆ, ( )

i

N Varx

4.3. Hata Terimi Varyansının Tahmini

Ana kütle parametrelerinin tahmininden sonra, bilinmeyen ve örnek verilerinden tahmin

edilmesi gereken diğer bir unsur sabit olduğu varsayılan ana kütle hata teriminin varyansıdır.

Klasik doğrusal regresyon modelinin temel varsayımlarından biri gözlemler (alt ana kütle)

itibariyle hata teriminin varyansının eşit olmasıdır. Hata teriminin beklenen değerinin sıfır

olduğu varsayımı ( 0iE u ) doğru ise, iu ’nin varyansı aşağıdaki gibidir.

22 2( )i i i iVar u E u E u E u ( ) 0iE u

“Beklenti” ortalama bir değer olduğu için, tahmin edilen 2 ’yi, hata karelerinin

ortalaması olarak aşağıdaki gibi düşünülebilir.

2

2 iu

n

Ana kütle bilinmediği için rassal hatalar iu gözlemlenemeyecek bu nedenle yukarıdaki

formülün kullanımı söz konusu olmayacaktır. Ancak bilinmeyen rassal hataların yerine

örnekten hesaplanan EKK kalıntıları kullanılabilir. Böylece, rassal hatalar ile kalıntılar yer

değiştirerek hata terimi varyansının tahmini için aşağıdaki gibi kullanılabilir,

2

2ˆ

ˆ iu

n

Büyük örneklerde oldukça tatmin edici olmasına karşın, bu tahminci, 2 ’nın sapmalı

bir tahmincisidir. Fakat sapmasız tahminciyi elde etmek için basit bir değişiklik aşağıdaki gibi

yapılır,

2

2ˆ

ˆ2

iu

n

Paydada çıkarması yapılan 2, modeldeki regresyon parametreleri ( 0 ve 1 ) ’lerin

sayısı olup, bu çıkarım, 2 ’yi sapmasız yapar böylece,

2 2Ê

olur.

110

4.4. Uygulama: Satış Gelirleri İle Reklam Harcamaları

Satışlar ile reklam harcamaları arasındaki doğrusal ilişki örnek verilerinden

ˆ 1.0 1.2i iY X ve 2îu =8.8

olarak hesaplanmıştı. Şimdi 0 ve 1 ’in varyansları, standart hatalarını ve 0 ve 1

arasındaki kovaryansı hesaplayacağız.

2

2

0 2ˆ ˆ( )

i

i

XVar

n x

2

1 2

ˆˆ( )i

Varx

2

0 1 2ˆ ˆ ˆ( , )

i

XCov

x

0ˆ( )Var , 1

ˆ( )Var ve 0 1ˆ ˆ( , )Cov ’in hesaplanabilmesi için öncelikle hata terimi

varyansının tahmin edilmesi gerekir. Hata terimi varyansının tahmini ( 2 ) aşağıdaki gibidir.

2

2ˆ 8.8 8.8

ˆ 2.932 5 2 3

iu

n

2

iX 55 ,

2 10ix , 3X olduğu bilindiğine göre;

2

2

0 2

55ˆ ˆ( ) 2.93 3.2235.10

i

i

XVar

n x

2

1 2

ˆ 2.93ˆ( ) 0.29310i

Varx

2

0 1 2

3ˆ ˆ ˆ( , ) 2.93 0.87910i

XCov

x

0 ve 1 ’in standart hataları ise,

0 0ˆ ˆ( ) ( ) 3.223 1.795Se Var

1 1ˆ ˆ( ) ( ) 0.293 0.541Se Var

111

olarak hesaplanır. Şu ana kadar yaptığımız hesaplamalar toplu biçimde aşağıdaki gibi

raporlanır.

2ˆ ˆ1.0 1.2 2.93 5

( ) (1.795)(0.541)

i i

i

Y X n

Se

4.5. Esneklikler

Gelir esneklikliği, gelirdeki değişimler karşısında tüketicinin tepkisini göstermektedir.

Doğrusal bir ilişkide Y değişkenin, X değişkenine göre esnekliği aşağıdaki gibi hesaplanır:

'deki yüzdedeğişim

'deki yüzdedeğişim

Y Y Y Y X

X X X X Y

0 1i iE Y X X X ile verilen doğrusal ekonomik modelde, 1 ’i aşağıdaki gibi

tanımlamıştık.

1

E Y

X

Bu durumda, gelire göre ortalama harcama esnekliği aşağıdaki gibi hesaplanır:

1

E Y E Y E Y X X

X X X E Y E Y

Esnekliği hesaplamak için 1 yerine, örnek verilerinden hesaplanan 1 gelir. Ayrıca “X

” ve “ E Y ” de değiştirilmek zorundadır. Çünkü doğrusal bir modelde esneklik, regresyon

doğrusu boyunca her bir noktada farklıdır. Çoğunlukla, esneklik “ortalamalar noktasından

,X Y hesaplanır, çünkü regresyon doğrusunda bu uygun bir temsil noktasıdır. Buna göre

ortalamalar noktasında gelir esnekliğini hesaplamak istersek aşağıdaki formül kullanılır.

1ˆˆ

X

Y

Ortalamaya göre esneklik hesaplanabileceği gibi X’in belli bir değere eşit ( iX X )

olduğu nokta için de hesaplanabilir. Bu durumda iX X olduğu noktada regresyon

denkleminden îX XY ’nin hesaplanması gerekir.

0 1ˆ ˆˆ

iX X iY X

Buradan esneklik,

112

1ˆˆ

î

i

X X

X

Y

formulü ile hesaplanır.

4.6. Uygulama: Satış Gelirleri İle Reklam Harcamaları

Satış Gelirleri ile reklam harcamaları örnek verilerinden aşağıdaki sonuçlara

ulaşılmıştı.

ˆ 1.0 1.2i iY X 4.6Y 3X

Yukarıdaki sonuçlara göre, ilk olarak satışların reklam harcamalarına göre ortalama

esnekliğini hesaplayalım. X ve Y örnek ortalama değerler ( , ) (3,4.6)X Y olduğuna göre

satışların reklam harcamalarına göre ortalama esnekliği aşağıdaki gibi hesaplanmaktadır.

1

3ˆˆ 1.2 0.784.6

X

Y

( , ) (3,4.6)X Y alındığında, reklam harcamalarındaki %1’lik bir artış, satışlarda

ortalama %0.78’lik bir artışa yol açar. Tahmin edilen reklam harcamaları esnekliği birden

küçük olduğu için, satışların arttırılması için reklam harcamalarının zorunlu olduğu sonucunu

çıkarmak mümkündür.

İkinci olarak X=5 olduğu noktada satışların reklam harcamalarına göre ortalama

esnekliğini hesaplayalım. X=5 ise ˆ 1.0 1.2 5 7iY ’dir. ˆ( , ) (5,7)ii xX Y noktasında

satışların reklam harcamalarına göre esnekliği aşağıdaki gibi hesaplanmaktadır.

1

5ˆˆ 1.2 1ˆ 6

i

i

X X

X X

Y

ˆ( , ) (5,7)ii xX Y noktasında birim esneklik söz konusudur. Reklam harcamalarındaki

%1’lik bir artış, satışlarda %1’lik bir artışa yol açar

113

Uygulamalar

1. Amaç, ikinci bölümde hipotetik verileri verilen ve üçüncü bölümde Örnek 1 ve

Örnek 2 verilerinden ana kütle parametrelerinin tahmin edildiği modellerde yer alan

parametrelerin varyans ve kovaryanslarının hesaplanmasıdır.

Dikkat edilecek olursa bu uygulamada ara sonuçlardan hareket ettiğimiz için 2

iu’ne sahip değiliz. Öncelikle ˆ 17.29 0.61i iY X denkleminde X ’in değerleri yerine

konur, îY ’ler hesaplanır. Daha sonraki aşamada îu ,

2îu ve

2

iu hesaplanır.

ÖRNEK 1

iY iX îY ˆ

iu 2îu

65 80 66.09 -1.09 1.1881

80 100 78.29 1.71 2.9241

79 120 90.49 -11.49 132.0201

113 140 102.69 10.31 106.2961

125 160 114.89 10.11 102.2121

115 180 127.09 -12.09 146.1681

144 200 139.29 4.71 22.1841

157 220 151.49 5.51 30.3601

155 240 163.69 -8.69 75.5161

178 260 175.89 2.11 4.4521

1211iY 1700iX ˆ 1209.9iY ˆ 1.1iu 2ˆ 623.321iu

Önemli not: ˆ 0iu , ˆ 1211i iY Y olarak hesaplanması gerekir. Hesaplamalardaki

ufak farklılıklar, ˆ 17.29 0.61i iY X denkleminde virgülden sonra iki hane alındığı içindir.

Hata terimi varyansının tahmini ( 2 ) aşağıdaki gibidir.

2

2ˆ 623.321 623.321

ˆ 77.922 10 2 8

iu

n

2 322000iX , 170X ,

2 33000ix olduğu bilindiğine göre;

114

2

2

0 2

322000ˆ ˆ( ) 77.92 76.0310 33000

i

i

XVar

n x

2

1 2

ˆ 77.92ˆ( ) 0.00236133000i

Varx

2

0 1 2

170ˆ ˆ ˆ( , ) 77.92 0.40133000i

XCov

x


0 0ˆ ˆ( ) ( ) 76.03 8.72Se Var

1 1ˆ ˆ( ) ( ) 0.002361 0.049Se Var

olarak hesaplanır. Şu ana kadar yaptığımız hesaplamalar toplu biçimde aşağıdaki gibi

raporlanır.

2ˆ ˆ17.29 0.61 77.92 10

( ) (8.72)(0.049)

i i

i

Y X n

Se

Örnek 2

ˆ 9.37 0.65i iY X

ÖRNEK 2

iY iX îY ˆ

iu 2îu

55 80 61.37 -6.37 40.5769

74 100 74.37 -0.37 0.1369

90 120 87.37 2.63 6.9169

103 140 100.37 2.63 6.9169

107 160 113.37 -6.37 40.5769

135 180 126.37 8.63 74.4769

144 200 139.37 4.63 21.4369

160 220 152.37 7.63 58.2169

189 240 165.37 23.63 558.3769

150 260 178.37 -28.37 804.8569

1211iY 1700iX 11 8.7ˆ 9iY ˆ 8.3iu 2 1612 4 9ˆ . 8iu

115

Önemli not: ˆ 0iu , ˆ 1211i iY Y olarak hesaplanması gerekir. Hesaplamalardaki ufak

farklılıklar, ˆ 9.37 0.65i iY X denkleminde virgülden sonra iki hane alındığı içindir.

Hata terimi veryansının tahmini ( 2 ) aşağıdaki gibidir.

2

2ˆ

ˆ 201.562 1

1612.489 1612.48

0 2 8

9iu

n

2 322000iX , 170X ,

2 33000ix olduğu bilindiğine göre;

2

2

0 2196.

322000ˆ ˆ( ) 201.5610 330

50

670

i

i

XVar

n x

2

1 2

ˆ 201.50.

6ˆ( )3

000

03 0

6i

Varx

2

0 1 2

170ˆ ˆ ˆ( , ) 201. 1.0385633000i

XCov

x


0 0ˆ ˆ( ) ( ) 196.6 14 0275 .Se Var

1 1ˆ ˆ( ) ( ) 0.006 0.08Se Var

olarak hesaplanır. Şu ana kadar yaptığımız hesaplamalar toplu biçimde aşağıdaki gibi gösterilir.

2ˆ ˆ9.37 0.65 201.56 10

( ) (14.02)(0.08)

i i

i

Y X n

Se

Sonuç: Yukarıdaki sonuçlara göre parametre tahminlerin standart hataları Örnek 1’de,

Örnek 2’den daha küçük hesaplanmıştır. Buna göre Örnek 1, Örnek 2’ye tercih edilir.

2. Tüketim Modeli için esnekliklerin hesaplanması

Örnek 1

ˆ 17.29 0.61i iY X 121.1 170Y X

Ortalamalar noktasında - ( , ) (170,121.1)X Y - gelir esnekliği aşağıdaki aşağıdaki gibi

hesaplanır.

1

170ˆˆ 0.61 0.86121.1

X

Y

116

X ve Y örnek ortalama değerlerini ( , ) (170,121.1)X Y aldığında, hane halkı gelirindeki

%1’lik bir artış, ortalama olarak hane halkı tüketim harcamasında %0.86’lık bir artışa yol açar.

Tahmin edilen gelir esnekliği birden küçük olduğu için, tüketim harcamaları “lüks” değil

“zorunlu” dur -ki bu sonuç, ortalama bir hane halkı için beklentilerimizle ile tutarlıdır.

İkinci olarak X=160 olduğu noktada ortalama gelir esnekliğini hesaplayalım. X=160 ise

ˆ 17.29 0.61 160 114.89iY ’dur. ˆ( , ) (160,114,89)ii xX Y noktasında gelir esnekliği


1

160

160 160ˆˆ 0.61 0.85ˆ 114.89X

X

Y

Gelirin 160 olduğu noktada tüketimin gelir esnekliği 0.85’e eşittir. Diğer bir ifade ile gelir %1

artarsa, tüketim %0.85 artacaktır.

Örnek 2

ˆ 9.37 0.65i iY X 120.7 170Y X

Ortalamalar noktasında - ( , ) (170,120.7)X Y - gelir esnekliği aşağıdaki aşağıdaki gibi

hesaplanır.

1

170ˆˆ 0.65 0.92120.7

X

Y

X ve Y örnek ortalama değerlerini ( , ) (170,120.7)X Y aldığında, hane halkı gelirindeki

%1’lik bir artış, ortalama olarak hane halkı tüketim harcamasında %0.92’lık bir artışa yol açar.

Bu örnek verilerinden de tahmin edilen gelir esnekliği birden küçük olduğu için, tüketim

harcamaları “lüks” değil “zorunlu” dur.

İkinci olarak X=220 olduğu noktada ortalama gelir esnekliğini hesaplayalım. X=220 ise

ˆ 9.37 0.65 220 152.37iY ’dir. ˆ( , ) (220,152.37)ii xX Y noktasında gelir esnekliği


1

220

220 220ˆˆ 0.65 0.94ˆ 152.37X

X

Y

ˆ( , ) (220,152.37)ii xX Y noktasında hane halkı gelirindeki %1’lik bir artış, hane halkı

tüketim harcamasında %0.94’lük bir artışa yol açar.

117

Uygulama Soruları

Aşağıdaki veriler kullanılarak,

Gözlem Satış (100 lira) Fiyat (1 lira)

1 6 10

2 4 20

3 5 30

4 4 40

5 3 50

6 1 60

2 2

2 2

23 , 210 , 35 , 3.83

660 , 9100 , 103

14.83 , 1750 , 145

i i

i i i i

i i i i

Y X X Y

X Y X Y

y x x y

Ara sonuçlar hesaplanmış, buradan örnek regresyon denklemi tahmin edilmiş ve kalıntıların

karelerinin toplamı hesaplanmıştır.

ˆ 6.73 0.08i iY X 2ˆ 2.82îu

Not: Yukarıdaki verileri kullanarak ara sonuçları ve regesyon fonksiyonunu siz de elde edin.

1. Ana kütle hata teriminin varyansını tahmin ediniz?

Ana kütle hata terimi varsayının tahmicisinin2 2ˆ ˆ 2îu n olduğu bilindiğine göre;

2

2ˆ 2.82 2.82

ˆ 0.7052 6 2 4

îu

n

olarak tahmin edilir.

2. 0ˆ 6.73 olarak tahmin edilen 0 parametresinin varyansını tahmin ederek,

standart hatasını hesaplayınız.

Yukarıda hesapladığımız ara sonuçları kullanarak 0 parametresi için varyans

tahminini bulabiliriz.

2

2

0 2

9100ˆ ˆ( ) 0.705 0.6116 1750

i

i

XVar

n x

118

0 0ˆ ˆ( ) ( ) 0.611 0.782Se Var

3. 1ˆ 0.08 olarak tahmin edilen 1 parametresinin varyansını tahmin ederek,

standart hatasını hesaplayınız.

Yukarıda hesapladığımız ara sonuçları kullanarak 1 parametresi için varyans

tahminini bulabiliriz.

2

1 2

ˆ 0.705ˆ( ) 0.00041750i

Varx

1 1ˆ ˆ( ) ( ) 0.0004 0.02Se Var

4. 0 ile 1 arasındaki ortakvaryansı hesaplayınız.

2

0 1 2

35ˆ ˆ ˆ( , ) 0.705 0.01411750i

XCov

x

5. 1-4 arası sonuçları raporlayınız.

2 2ˆ ˆ ˆ6.73 0.08 0.705 2.82

ˆ( )(0.782)(0.02)

i i î

i

Y X u

Se

6. Ortalama fiyat esnekliğini hesaplayarak yorumlayınız.

35 , 3.83X Y ise 1

35ˆˆ ( 0.08) 0.733.83

X

Y

Fiyatlar %1 artarsa satışlar (talep) %0.73 azalacaktır.

7. Fiyatın 40 olduğu noktada fiyat esnekliğini hesaplayarak yorumlayınız.

Öncelikle 40X olduğu 40ˆXY hesaplanması gerekir.

40ˆ 6.73 0.08(40) 3.53XY

1

40

40 40ˆˆ 0.08 0.91ˆ 3.53X

X

Y

Fiyatın 40 olduğu noktada, fiyatlardaki %1 lik artış satışları %0.91 düşürür.

119


Bu bölümde tahmin edilen parametrelerin güvenilirlik ölçüsü standart hatanın nasıl

hesaplandığı ve standart hatanın örnek verilerinden hesaplanan unsurlara göre nasıl değişiklik

göstereceği detaylı olarak verildi. Yine standart hataların hesaplanmasında bize gerekli olan

rassal hatanın varyansının tahmini verildi.

Bu bölümde iktisat derslerinizden bildiğiniz esneklik kavramının, ekonometrik bir

modelden nasıl hesaplandığını gördünüz.

120

Bölüm Soruları

Aşağıdaki 1-8 arası sorular için aşağıdaki verileri kullanarak cevaplandırınız.

Yıllar Y X

1991 1.3 6.2

1992 1.2 7.8

1993 1.4 5.8

1994 1.4 5.7

1995 1.5 5.0

1996 1.9 4.0

1997 2.6 3.2

1998 2.3 3.6

1999 2.5 3.3

2000 2.7 3.3

2001 2.1 5.6

2002 1.8 6.8

2003 2.2 5.6

1. Örnek regresyon fonksiyonunun ( 0 1ˆ ˆˆ

i iY X ) tahmini aşağıdakilerden

hangisidir?

a) ˆ 9.44 2.28i iY X

b) ˆ 1.09 2.28i iY X

c) ˆ 10.04 1.09i iY X

d) ˆ 6.32 0.96i iY X

e) ˆ 3.37 0.29i iY X

2. Kalıntı kareler toplamı aşağıdakilerden hangisidir.

a) 108.2

b) 65.1

c) 1.14

d) 3.44

e) 9.12

3. Ana kütle hata teriminin varyansını tahmini aşağıdakilerden hangisidir?

a) 0.104

b) 13.94

c) 0.806

d) 0.828

e) 0.653

4. 0 ve 1 ’in varyansları aşağıdakilerden hangisidir?

a) 0ˆ 0.986049Var , 1

ˆ 0.251001Var

121

b) 0ˆ 0.605409Var , 1

ˆ 3.97642Var

c) 0ˆ 0.109561Var , 1

ˆ 0.003969Var

d) 0ˆ 3.209782Var , 1

ˆ 6.083561Var

e) 0ˆ 3.218008Var , 1

ˆ 9.71387Var

5. 0 ve 1 ’in standart hataları aşağıdakilerden hangisidir?

a) 0ˆ 1.082Se , 1

ˆ 0.208Se

b) 0ˆ 0.331Se , 1

ˆ 0.501Se

c) 0ˆ 2.213Se , 1

ˆ 4.916Se

d) 0ˆ 0.331Se , 1

ˆ 0.063Se

e) 0ˆ 0.993Se , 1

ˆ 0.501Se

6. 0 ve 1 arasındaki ortak varyans aşağıdakilerden hangisidir?

a) 0.03961

b) 0.02006

c) -0.03961

d) 0.93071

e) -0.02006

7. Y’nin X’e göre ortalama esnekliği ve yorumu aşağıdakilerden hangisidir?

a) -0.77; X’deki %1’lik artış Y’de ortalama %0.77’lik azalışa neden olur.

b) -0.77; X’deki 1 birimlik artış Y’de ortalama %77’lik azalışa neden olur.

c) -0.77; X’deki %1’lik artış Y’de ortalama % 77’lik azalışa neden olur.

d) 0.77; X’deki %1’lik artış Y’de ortalama % 0.77’lik artışa neden olur.

e) 0.77; X’deki %1’lik artış Y’de ortalama % 77’lik artışa neden olur.

8. X=5.7 iken Y’nin X’e göre esnekliği ve yorumu aşağıdakilerden hangisidir?

a) -0.96 ; X=5.7 noktasında X’deki %1’lik artış Y’de % 96’lik azalışa neden olur.

b) 0.96 ; X=5.7 noktasında X’deki %1’lik artış Y’de % 0.96’lik artışa neden olur.

c) -0.96 ; X=5.7 noktasında X’deki 1birimlik artış Y’de 0.96 birimlik azalışa neden

olur.

d) 0.96 ; X=5.7 noktasında X’deki 1 birimlik artış Y’de % 0.96 birimlik azalışa

neden olur.

e) -0.96 ; X=5.7 noktasında X’deki %1’lik artış Y’de % 0.96’lik azalışa neden olur.

9. 0 ’ın varyansı için aşağıdaki ifadelerden hangisi yanlıştır.

a) Hata teriminin varyansı büyüdükçe, 0 ’ın varyansı da büyür.

b) X ‘lerin ortalamadan farklarının karesi büyüdükçe 0 ’ın varyansı küçülür.

c) Gözlem sayısı n büyüdükçe 0 ’ın varyansı küçülür.

122

d) ) Gözlemlenen X’ler, örnek regresyon doğrusuna yaklaştıkça 0 ’ın varyansı

küçülür.

e) Gözlemlenen X’lerin karelerinin toplamı büyüdükçe 0 ’ın varyansı büyür

10. Aşağıdaki ifadelerden hangisi yanlıştır.

a) Tahmin edilen parametrelerin varyansları örnekten örneğe değişir.

b) İki parametre tahmininden hangisinin daha varyansı daha küçük ise o parametre

daha güvenilirdir.

c) Tahmin edilen parametrelerin varyanslarını etkileyen unsurlardan biri hata teriminin

varyansıdır.

d) Nokta esnekliği her noktada değişir.

e) Basit regresyon modelinde hata teriminin varyansının tahmincisi 2 2ˆ 2ix n

dir.

Cevaplar

1) e

2) c

3) a

4) c

5) d

6) e

7) a

8) e

9) d

10) e

123

5. ARALIK TAHMİNİ VE HİPOTEZ TESTİ

124


5.1. Aralık Tahmini

5.1.1. Normal Dağılım ve t-Dağılımı

5.1.2. Aralık Tahminlerini Elde Etme

5.1.3. Açıklayıcı Uygulama: Satış Modeli

5.2. Hipotez Testleri

5.2.1. Temel Hipotez

5.2.2. Alternatif Hipotez

5.2.3. Test İstatistiği

5.2.4. Red Bölgesi

5.2.5. Karar

5.3. Hipotez Testi Örnekleri

5.3.1. Çift Kuyruk Testi

5.3.2. Çift Kuyruk Anlamlılık Testi

125


1) Nokta tahminlerinden aralık tahminlerine geçebilir miyiz?

2) Verilen bir hipotezi nasıl test ederiz?

3) Hipotez testinin aşamaları nelerdir?

126




Güven aralıklarının

oluşturulması ve

yorumlanması

Gerçek parametre değerinin

hangi aralıkta olabileceği

hakkında fikir sahibi olmak

İstatistik kitapları, Ders

notları ve uygulamaların

tekrarı,

Hipotez testlerinin aşamaları

ve uygulaması

Ana kütle hakkında çıkarım

yapabilmek

İstatistik kitapları, Ders

notları ve uygulamaların

tekrarı

127

Anahtar Kavramlar

Aralık Tahmini

Normal Dağılım

t-Dağılımı

Hipotez testi

Temel Hipotez

Alternatif Hipotez

Anlamlılık düzeyi

Kiritik (tablo değeri) Değer

Serbestlik dercesi

Test İstatistiği

128

Giriş

Bölüm 3'de basit doğrusal regresyon modelindeki parametrelerin nokta tahminlerini

elde etmek için en küçük kareler yaklaşımını kullandık. Bu nokta tahminleri, regresyon

fonksiyonu 0 1i iE Y X X ’daki iktisadi değişkenler arasındaki ilişkiyi tanımlayan bir

istatistiksel bilgi çıkarımı’dır. Bilgi çıkarma “bilinen veya varsayılan bir şeyden yola çıkarak

bir sonuca varma'' anlamındadır. Nokta tahminleri için iktisadi değişkenler arasında nedensellik

ilişki olduğu ve basit regresyon modeli ile ilgili 1-5 varsayımlarının geçerli olduğu varsayımları

yapılmıştır. Örnek regresyon fonksiyonunun tahmindeki amaç, bu varsayımlara dayanarak

örnek regresyon parametrelerinin ampirik tahminlerinden ( 0 1ˆ ˆ, ), verilerin elde edildiği ana

kütle hakkında bilgi çıkarımları yapmaktır.

Bu bölümde istatistiksel bilgi çıkarımının araçları aralık tahmini ve hipotez testi

tanıtılacaktır. (Hipotez testlerinden sadece çift kuyruk hipotez testleri ele alınacak olup tek

kuyruk hipotez testleri kapsam dışı bırakılmıştır.)

Hipotez testi ve aralık tahmini prosedürleri, basit doğrusal regresyon modelinin 6.

varsayımı “ hata terimleri normal dağılır” ve bunun bir sonucu olan EKK tahmincilerinin

normallik varsayımı ile yakinen ilgidir. Normallik varsayımı geçerli olmadığı durumda ancak

örneklem boyutu yeterince büyük ise EKK tahmincileri yaklaşık olarak normal dağılır.

Güven aralığı olarak da bilinen aralık tahmini, bilinmeyen parametrelerin içinde

bulunmasının olası olduğu bir değerler aralığı yaratma prosedürüdür.

Hipotez testi regresyon parametreleri ile ilgili varsayımı, bir veri örnekleminden elde

edilen parametre tahminleriyle karşılaştırma prosedürüdür. Hipotez testleri, verilerin belirli bir

varsayım veya hipotezle bağdaşıp bağdaşmadığı hakkında bilgi sağlar.

129

5.1. Aralık Tahmini

Bölüm 2 verilen uygulamada Örnek 1 verilerinden ( ˆ 17.29 0.61i iY X ) 1ˆ 0.61 ,

hane halkı harcanabilir gelir 100 lira arttığında, haftalık beklenen tüketim harcamasının artış

miktarıdır. Böylece haftalık gelir 100 lira arttığında, haftalık gıda harcaması ortalama 61 lira

artacağı tahmin edilmişti.

1ˆ 0.61 , regresyon modelindeki bilinmeyen ana kütle parametresinin (

1 ) bir nokta

tahminidir. Aralık tahmini, gerçek parametre 1 ’in bulunmasının olası olduğu bir değer aralığı

sunar. Bir değer aralığı sunmak, parametre değerinin ne olabileceği hakkında bir fikir ve ne

kadar kesinlikle tahmin ettiğimizi verir. Böyle aralıklar genellikle güven aralıkları adını alır.

5.1.1. Normal Dağılım ve t-Dağılımı

Basit doğrusal regresyon modeli için 1-6 varsayımlarının geçerli ise, en küçük kareler

tahmincileri 0 ve 1 normal dağılıma sahiptir.

0 ve 1 ’in en küçük kareler tahmincileri

0

ve 1 ’in normal dağılım parametreleri (ortalama ve varyansı) aşağıdaki gibidir.

2 2

0 0 2ˆ ,

i

i

XN

n x

2

1 1 2ˆ ,

i

Nx

1 için standardize edilmiş bir normal rassal değişken ise, 1 ’den ortalaması çıkarılıp

standart sapmasına bölünerek elde edilir:

1 1

2 2

ˆ0,1

i

Z Nx

Standardize edilmiş rassal değişken Z, 0 ortalama ve 1 varyansla normal dağılmıştır.

Normal dağılım tablosundan aşağıdaki eşitsizliği yazabileceğimizi biliyoruz. (Not: İstatistik

dersi konularından normal dağılımın özelliklerini ve normal dağılım tablosunu kullanmasını

hatırlayın, eksiğiniz varsa bu konuları İstatistik kitaplarından tekrar edin.)

1,96 1,96 0.95P Z

2 2

1 1ˆ

iZ x ‘ yi yukarıdaki eşitsizliğin içine yerleştirirsek,

1 1

2 2

ˆ1.96 1.96 0.95

i

Px

130

elde ederiz. Bu sonuç ana kütle parametresi 1 için yeniden düzenlenirse aşağıdaki ifadeyi

verir:

2 2

1 1 12 2ˆ ˆ1.96 1.96 0.95

i i

Px x

1 1 1 1 1ˆ ˆ ˆ ˆ1.96 ( ) 1.96 ( ) 0.95P SE SE

Bu, ana kütle 1 parametresini içerme olasılığı 0.95 olan bir aralığı tanımlar. Kısaca alt

ve üst sınırı 1 1ˆ ˆ1.96 ( )SE olan bir aralık tahmincisi sunar. Tekrarlanan örneklemede

yukarıdaki şekilde oluşturulan aralıkların %95 ‘i, 1 parametresinin gerçek değerini

içerecektir. Aralık tahmincisinin bu kolay türetimi hem 6. varsayıma yani hata terimlerinin

normal dağıldığına hem de hata terimi ( 2 ) varyansını biliyor olmamıza dayanmaktadır.

Ancak ana kütle hata terimi varyansının ( 2 ) değerini bilmediğimizi tahmin

edebileceğimizi daha önceki derslerimizden biliyoruz. En küçük kareler artıkları

0 1ˆ ˆˆ

i i i i iu Y Y Y X ve ana kütle hata terimi veryansının 2 tahmincisi

2 2ˆ ˆ 2iu n olduğunu da daha önceki derslerimizde gördük. Böylece 2 , 2 ile

değiştirerek çalışabileceğimiz bir rassal değişken elde ederiz ama bu yer değiştirme, olasılık

dağılımını standart normalden n-2 serbestlik dereceli bir 𝑡-dağılımına dönüştürür:

1 1 1 1 1 1

22 211

ˆ ˆ ˆ

ˆˆ ( )ˆ ( )n

i

t tSex Var

2 2

1 1ˆ ˆ

it x oranı (test istatistiği ile de adlandırılır.) 2nt t

ile gösterilen n-2

serbestlik dereceli bir t-dağılımına sahiptir. Benzer bir sonuç 0 için de geçerlidir, bu nedenle

basit doğrusal regresyon modelindeki 1-6 varsayımları gerçekleşiyorsa;

2

ˆ0,1 için

ˆ( )

i i

n

i

t t iSe

sonucunu çıkarabiliriz.

Bu eşitlik basit doğrusal regresyon modelindeki hipotez testi ve aralık tahmini için

temeli oluşturur.

t-dağılımı sıfırda ortalanmış çan-şeklinde bir eğridir. Daha büyük bir varyans ve daha

kalın kuyruklarla daha yayılmış olması dışında, standart normal dağılım gibi görünür, kısaca

normal dağılıma göre daha basık ve daha kalın kuyrukludur. t-dağılımının şekli, genellikle s.d.

şeklinde gösterilen ve serbestlik derecesi (n-k) adı verilen bir parametre tarafından kontrol

edilir. Burada n gözlem sayısını k parametre sayısını (basit regresyonda k=2) ifade eder. (n-

k)=m ise m serbestlik dereceli bir t-dağılımını belirtmek için ( )n kt veya mt gösterimleri

131

kullanılır1. Örneğin, (n-k)=m serbestlik derecesi için t-dağılımının 95'inci persentili 0.95,n kt

veya 0.95,mt şeklinde gösterilir. Olasılığın 0.95'i bu değerin soluna düşer, bu nedenle 𝑃[𝑡(𝑚) ≤

𝑡(0.95,𝑚)] = 0.95 . Örneğin, eğer serbestlik derecesi 𝑚 = 20 ise, t dağılım tablosundan,

𝑡(0.95,2) = 1.725 bulunur.

5.1.2 Aralık Tahminlerini Elde Etme

𝑡-dağılımından `kritik değer' 𝑡𝑐 bulabiliriz öyle ki 2c cP t t P t t ’dir ve

burada 𝛼 genellikle 𝛼 = 0.01 , 𝛼 = 0.0 5 ya da 𝛼 = 0.10 olarak alınan bir olasılıktır. Kritik

değer 𝑡𝑐 'nin 𝑛-k serbestlik derecesi için persentil değeri 2,n kt

. 𝑡𝑐 ve −𝑡𝑐 değerleri aşağıdaki

şekilde gösterilmektedir.

Şekil 5.1: Bir t-dağılımından kritik değerler

Taralı her ``kuyruk'' alanı olasılığın 2 kadarını taşır, bu nedenle olasılığın 1 − 𝛼

kadarı ortadaki kısımdadır. Sonuç olarak olasılık ifadesini aşağıdaki şekilde yazabiliriz:

𝑃(−𝑡𝑐 ≤ 𝑡 ≤ 𝑡𝑐) = 1 − 𝛼

%95 güven aralığı için kritik değerler 𝑡-dağılımının 1 − 𝛼 = 0.95 olasılığını taşıyan

merkezi bir bölge tanımlarlar. Bu, 𝛼 = 0.05 olasılığı iki kuyruk arasında eşit olarak bölerek

bırakır, böylece 𝛼/2 = 0.025 olur. Öyleyse kritik değer 𝑡𝑐 = 𝑡(1−0.025,𝑛−𝑘) = 𝑡(0.975,𝑛−𝑘) .

Basit regresyon modelinde serbestlik derecesi 𝑚 = 𝑛 − 2 'dir, böylece yukarıdaki ifade şu

şekle dönüşür:

𝑃[−𝑡(0.975,𝑛−2) ≤ 𝑡 ≤ 𝑡(0.975,𝑛−2)] = 0.95

Örneğin n=30 ise 𝑡(0.975,𝑛−2) =𝑡(0.975,28) persentil değerlerini t-. tablosundan 2.048

buluruz.

Şimdi tüm bu parçaları aralık tahmini prosedürü yaratmak için kullanacağız. Yukarıda

2 2

1 1ˆ ˆ

ix ile ifade edilen t, 𝑃(−𝑡𝑐 ≤ 𝑡 ≤ 𝑡𝑐) ‘ye yerleştirerek aşağıdaki ifade elde

edilir:

1 5. Haftanın sonunda Tablo …'de çeşitli serbestlik derecelerine sahip 𝑡 -dağılım persentil (kritik) değerleri

verilmiştir.

132

ˆ1

ˆ( )

i ic cP t t

Se

Bu ifadeyi yenideni için düzenleyerek aşağıdaki ifade elde edilir:

ˆ ˆ ˆ ˆ( ) ( ) 1i c i i i c iP t Se t Se

Aralığın alt ve üst değerleri ˆ ˆ( )i c it Se ve ˆ ˆ( )i c it Se örneklemden örnekleme

değişeceği için rassaldır. Bu uç noktalar i için bir aralık tahmincisi tanımlarlar. Yukarıdaki

olasılık ifadesi, bilinmeyen gerçek parametre i ’nin 1 − 𝛼 olasılığı ile ˆ ˆ( )i c it Se aralığının

içinde olduğu anlamına gelmektedir.

Olasılık ifadesindeki î ve ˆ( )iSe , verilen örneklem verilerine dayanarak tahmin

edilen değerler (sayılar) olduğunda; ˆ ˆ( )i c it Se , i ’nin %100(1 − 𝛼) aralık tahmini

adını alır. Ynı zamanda %100(1 − 𝛼) bir güven aralığıdır. Geleneksel olarak 𝛼 = 0.01 , 𝛼 =

0.05 veya 𝛼 = 0.10 ‘dur. Bu nedenle %99 güven aralığı ,%95 güven aralığı veya %95

güven aralığı elde ederiz.

Güven aralıkların yorumlanması çok dikkat ister. Aralık tahmin prosedürlerinin

özellikleri tekrarlanan örnekleme kavramına dayanır. Eğer n boyutunda pek çok rassal

örneklem seçilir, her örneklem için en küçük kareler tahmini î ve onun standart hatası ˆ( )iSe

’i hesaplanır ve sonra her örneklem için ˆ ˆ( )i c it Se aralık tahmini oluşturulur ise, oluşturulan

aralıkların %100(1 − 𝛼) kadarı gerçek parametre i içerir.

5.1.3. Açıklayıcı Uygulama: Satış Modeli

Satış gelirleri ve reklam harcamaları verilerinin kullanıldığı uygulamada n=5 ve

serbestlik derecesi n-k ‘dan 5-2=3 ‘dür. Bir %95 güven aralığı için 𝛼 = 0.05. Kritik değer

𝑡𝑐 = 𝑡(1−𝛼/2,𝑛−2) = 𝑡(0.0975,3) = 3.182 serbestlik derecesi 3 olan 𝑡 -dağılımından 97.5

persentildir. Böylece olasılık ifadesi 1 için aşağıdaki gibidir.

1 1 1 1 1ˆ ˆ ˆ ˆ( ) ( ) 1c cP t Se t Se

1 ‘in en küçük kareler tahmini 1

ˆ 1.2 ve onun standart hatası

1 1ˆ ˆ( ) ( ) 0.293 0.541Se Var

Kullanılarak 1 için olasılık ifadesi aşağıdaki gibi yazılır.

11.2 3.182 0.541 1.2 3.182 0.541 0.95P

Buradan 1 için bir ``%95 güven aralığı tahmini'' aşağıdaki gibidir.

133

1 1ˆ ˆ( ) 1.2 3.182 0.541 0.52 ; 2.92ct Se

Bir firmanın yıllık reklam harcamaları 1 birim artmasıyla satış gelirlerinin 0.52 ile

2.92 arasında bir değişiklik göstereceğini %95 güvenle tahmin ediyoruz.

Peki, 1 gerçekten de 0.52 ; 2.92 aralığında mı? Bu sorunun cevabını bilmiyoruz ve

hiçbir zaman da bilemeyeceğiz. Bildiğimiz ise; kullandığımız prosedür aynı anakütleden alınan

pek çok rassal örnekleme uygulandığında bu prosedür kullanılarak oluşturulmuş aralık

tahminlerinin %95'i gerçek parametreyi içerecektir.

1 'nin aralık tahmininin yararı nedir? Regresyon sonuçlarını rapor ederken her zaman

bir nokta tahmini veririz, mesela 1ˆ 1.2 gibi. Ancak tek başına nokta tahmini güvenilirliği

açısından hiçbir anlam taşımaz. Dolayısıyla bir aralık tahmini de sunabiliriz. Aralık tahminleri

hem nokta tahminini hem de en küçük kareler tahmincisinin değişkenliğinin bir ölçümü olan

tahminin standart hatasını hesaba katar. Aralık tahmini örneklem boyutu için de bir tahsis içerir

çünkü daha düşük serbestlik dereceleri için 𝑡-dağılımı kritik değeri 𝑡𝑐 daha büyüktür. Bir aralık

tahmini genişse (büyük bir standart hatayı getirir), örneklemde 1 hakkında çok fazla bilgi

olmadığı anlamına gelir. Eğer aralık tahmini darsa1 hakkında daha fazla şey öğrendiğimizi

gösterir.

0 için aralık tahmini yapmak istersek, 0 ‘in en küçük kareler tahmini 0

ˆ 1 ve onun

standart hatası

0 0ˆ ˆ( ) ( ) 3.223 1.795Se Var

kullanılarak 0 için olasılık ifadesi aşağıdaki gibi yazılır.

0 0 0 0 0ˆ ˆ ˆ ˆ( ) ( ) 1c cP t Se t Se

01 3.182 1.795 1 3.182 1.795 0.95P

Buradan 0 için bir ``%95 güven aralığı tahmini'' aşağıdaki gibidir.

0 0ˆ ˆ( ) 1 3.182 1.795 4.71;6.71ct Se

Bir firmanın yıllık reklam harcamalarının dışındaki unsurların satış gelirlerinde 4.71

ile 6.71arasında bir değişiklik göstereceğine %95 güvenle tahmin ediyoruz.

5.2 Hipotez Testleri

Hipotez testi; bir anakütle ile ilgili olarak sahip olduğumuz varsayımı, bir veri

örneklemindeki bilgiyle karşılaştırır. Bir ekonomik ve istatistiksel model verili iken, hipotezler

ekonomik davranışlar hakkında kurulur. Bu hipotezler daha sonra model parametreler hakkında

ifadeler olarak sunulur. Hipotez testleri, hipotez hakkında bir sonuca varmak için bir parametre

hakkında bir veri örnekleminde bulunan bilgiyi, onun en küçük kareler tahminini ve standart

hatasını kullanır.

134

Hipotez testinin 5 bileşeni vardır. Bunlar

1. Temel Hipotez H0

2. Alternatif Hipotez H1

3. Test İstatistiği

4. Red Bölgesi

5. Sonuç

5.2.1 Temel Hipotez

0H ile gösterilen temel hipotez, genellikle i , (i=0 veya i=1) olarak gösterdiğimiz ana

kütle regresyon parametresi için bir değer belirler. Temel hipotez 0 : iH c şeklinde yazılır

ve c sıfır veya sıfırdan farklı sabit bir sayıdır.

Bir temel hipotez örneklem kanıtı tarafından doğru olmadığı kanıtlanana kadar

sürdürülen iddaa ’dır. Doğru olmadığı kanıtlandığı takdirde temel hipotezi reddedilir.

5.2.2 Alternatif Hipotez

Her temel hipotez, temel hipotez (0H ) reddedildiğinde kabul edilebilecek alternatif bir

hipotez 1H ile eşleştirilir. Genellikle iktisat teorisine dayanan alternatif hipotez esnektir.

0 : iH c temel hipotezi için olası üç alternatif hipotez aşağıdaki gibidir:

1 1 1: : :i i iH c H c H c

Eşitsizlik alternatif hipotezleri ekonomide yaygın olarak kullanılır, çünkü ekonomik

teori değişkenler arasındaki ilişkinin işareti hakkında sıkça bilgi sağlar. Örneğin, tüketim

harcaması örneğinde 1 1: 0H alternatifine karşı

0 1: 0H temel hipotezini de test etmek

edilir, çünkü iktisat teorisine göre 1 marjinal tüketim meylidir. 10 1 arasında yer

alacağı, negatif değer alamayacağı için alternatif hipotezin 1 0 olması gerekir.

Biz sizlerle Ekonometri dersinde sadece çift taraflı hipotez testlerini ele alacak, tek

taraflı hipotez testlerini kapasam dışı tutacağız.

5.2.3 Test İstatistiği

Temel hipotez hakkındaki örneklem bilgisi, bir test istatistiğinin örneklem değerinde

yer alır.

Test istatistiğinin değerine dayanarak temel hipotezi reddedip reddetmeyeceğimize

karar veririz.

135

Temel hipotez doğru iken, olasılık dağılımının bilinmesi gerekir. Eğer temel hipotez

0 : iH c doğruysa ˆ ˆ( )i i it Se ’de i yerine 𝑐 ' yi koyabilir ve aşağıdaki ifade

yazılabilir:

2

ˆ

ˆ( )

i i

n

i

t tSe

Eğer temel hipotez doğru değilse yukarıdaki 𝑡 -istatistiği n-2 serbestlik dereceli 𝑡 -

dağılımına sahip değildir.

5.2.4. Red Bölgesi

Red bölgesi, olası olmayan ve temel hipotez doğru iken düşük gerçekleşme olasılığına

sahip değerleri içerir. Red bölgesi alternatif hipotezin nasıl kurulduğuna bağlıdır. Temel

hipotezin reddine yol açan test istatistiğinin değerler aralığı red bölgesini oluşturur. Red

bölgesinin oluşturabilmesi, temel hipotez doğru iken dağılımı bilinen bir test istatistiği,

alternatif hipotez ve anlamlılık düzeyinin bilinmesi gerekir.

Eğer temel hipotez doğru iken reddedilirse, Birinci Tip hata yapılmış olur. Bir testin

anlamlılık düzeyi Birinci Tip hata yapma olasılığıdır. Testin anlamlılık düzeyi 𝛼 genellikle

0.01, 0.05, 0.10 olarak seçilir. Eğer yanlış olan bir temel hipotezi reddedilmezse İkinci Tip hata

yapılmış olur.

5.2.5. Karar

Bir hipotezi test etmeyi bitirdiğinizde sonucunuzu ortaya koymalıyız. Ancak temel

hipotezin ``kabul edildiği'' sonucunu yanıltıcı olabilir, alternatif hipotez reddedilmiş ise “temel

hipotezin reddi için bir neden yoktur” sonucu daha gerçekçidir. Ayrıca sonucun, ekonomik

anlamında ne ifade ettiğini belirtmek gerekir.

5.3. Hipotez Testi Örnekleri

5.3.1. Çift Kuyruk Testi

0 1ˆ ˆˆ

i iY X tahmin edilen model için ana kütle parametresi 1 ‘in 0.55 ‘eşit olup

olmadığını test etmek isteyebiliriz. Buna göre1 0.55 ile gösterebilir, bunun doğru olup

olmadığını test etmek istiyorsak, 1 0.55 alternatiftir. Bu alternatif 1 ’in 0.55’den daha

büyük veya daha küçük olacağı iddiasında bulunmaz, sadece 0.55 olmadığını savunur. Bu tip

durumlarda çift kuyruk testini aşağıdaki gibi kullanırız:

1. Temel hipotez, alternatif hipotez

0 1: 0.55H

1 1: 0.55H

136

2. Eğer temel hipotez doğru ise test istatistiği aşağıdaki gibidir.

1 1 1

2

1 1

ˆ ˆ 0.55

ˆ ˆ( ) ( )n

t tSe Se

3. 𝛼 = 0.05 olarak seçelim. Bu çift kuyruk testi için kritik değerler 2.5-persentil

𝑡(0.025,8) = −2.306 ve 97.5 persentil 𝑡(0.975,8) = 2.306. Dolayısıyla eğer 𝑡'nin

hesaplanan değeri 𝑡 ≥ 2.306 veya 𝑡 ≤ −2.306 ise temel hipotezi reddedeceğiz.

Eğer −2.306 < 𝑡 < 2.306 ise temel hipotezi reddetmeyeceğiz.

Şekil. 5. 2. 0 1:H c hipotezinin

1 1:H c hipotezine karşı bir testinin red

bölgesi .

4. Tüketim harcaması verileri için, 1ˆ 0.61 ve standart hatası 1

ˆ( ) 0.05Se ’dır.

Test istatistiğinin değeri aşağıda verilmiştir:

1 1

1

ˆ 0.61 0.55 0.061.2

ˆ 0.05 0.05( )t

Se

5. −2.206 < 𝑡 = 1.2 < 2.206 olduğu için 1 0.55 temel hipotezini reddetmeyiz.

Burada dikkat edilmesi gereken nokta, bu test sonucuna göre 1 0.55 olduğu

sonucuna ulaşılmaz, sadece verilerin bu parametre değeriyle bağdaşıyor olmadığını söylüyoruz.

Çok önemli bir husus, hipotez testinin temel hipotezin doğru olduğunu kanıtlamak için

kullanılamayacağıdır.

137

Eğer 0 1:H c temel hipotezi

1 1:H c hipotezine karşı test ediliyorsa, , 𝑡𝑐 =

𝑡(1−𝛼/2,𝑁−2) ’den

ˆ ˆ ˆ ˆ( ) ( )i c i i c it Se c t Se

güven aralıkları oluşturulur. Verilen anlamlılık düzeyi 𝛼'da 𝑐 güven aralığı içerisinde ise, temel

hipotez reddedilmez. Eğer 𝑐 güven aralığı dışında ise temel hipotez reddedilir. Bu kural sadece

çift kuyruk testleri için geçerlidir.

5.3.2. Çift Kuyruklu Anlamlılık Testi

Hipotez testinin amacı değişkenler arasında bir ilişkinin olup olmadığını belirlemek ise

0 1ˆ ˆˆ

i iY X tahmin edilen model için temel hipotez 1 0 ’dır, diğer bir ifade ile, bağımlı

değişken ile bağımsız değişken arasında hiçbir doğrusal ilişki olmadığıdır. 1 0 olan

alternatif bir ilişkinin var olduğu anlamına gelir ama değişkenler arasındaki ilişki pozitif de

olabilir negatif de olabilir. Bu, bir anlamlılık testinin en yaygın şeklidir. Testin adımları

aşağıdaki gibidir:

6. Temel hipotez, alternatif hipotez

0 1: 0H

1 1: 0H

.

7. Eğer temel hipotez doğru ise test istatistiği aşağıdaki gibidir.

1 1

1

ˆ

ˆ( )t

Se

Ancak temel hipotez 1 0 şeklinde verildiği için diğer bir ifade ile anlamlılık

sınaması yapıldığı için test istatistiğinde yer olan 1 sıfıra eşit olduğu için test

istatistiği sadeleşerek aşağıdaki biçimde yazılır.

1

2

1

ˆ

ˆ( )n

t tSe

8. 𝛼 = 0.05 olarak seçelim. Çift kuyruk test için kritik değerler 2.5-persentil

𝑡(0.025,8) = −2.306 ve 97.5-persentil 𝑡(0.975,8) = 2.306′dır Eğer 𝑡 'nin hesaplanan

değeri 𝑡 ≥ 2.306 veya 𝑡 ≤ 2.306 ise temel hipotezi reddedeceğiz. Eğer −2.306 <

𝑡 < 2.306 ise temel hipotezi reddetmeyeceğiz.

9. 1ˆ 0.61 ve standart hatası da 1

ˆ( ) 0.05Se ise, test istatistiğinin değeri aşağıda

verilmiştir:

1

1

ˆ 0.61 0.6112.2

ˆ 0.05 0.05( )t

Se

138

10. 𝑡 = 12.2 > 2.024 olduğu için 1 0 temel hipotezini reddederiz ve bağımlı

değişken ile bağımsız değişken arasında istatistiksel olarak anlamlı bir ilişki olduğu

sonucuna varırız. Başka bir açıdan test istatistiği (-2.306 ; 2,306) aralığının dışında

kaldığı için temel hipotez reddedilir.

Önemli not: İstatistik olarak anlamlı ifadesi her zaman iktisadi açıdan anlamlı olduğu

anlamına gelmez.

139

Uygulamalar

140

Uygulama Soruları

1. Tahmin edilen bir basit regresyon modelinde, 24 gözleme dayanarak, tahmin edilen

eğim parametresi 0.310 ve tahmin edilen standart hata 0.082'dir.

Buna göre aşağıdaki 1-5 arası soruları cevaplandırınız.

a) Eğimin sıfır olduğu hipotezini sıfır olmadığı alternatifine karşı %1 anlamlılık

düzeyinde test edin.

Temel hipotez, alternatif hipotez

0 1

1 1

: 0

: 0

H

H

𝛼 = 0.01 olduğuna göre çift kuyruk test için kritik değerler 2.5-persentil

𝑡(0.025,22) = −2.819 ve 97.5-persentil 𝑡(0.975,22) = 2.819′dır. Eğer 𝑡 'nin hesaplanan değeri

𝑡 ≥ 2.819 veya 𝑡 ≤ 2.819 ise temel hipotezi reddedeceğiz. Eğer −2.819 < 𝑡 < 2.819 ise

temel hipotezi reddetmeyeceğiz.

Test istatistiğinin hesaplanan değeri;

1

1

ˆ 0.3103.78

ˆ 0.082( )t

Se

3.78 2.819t t için 0H hipotezi reddedilir, eğim parametresi istatistiksel açıdan

anlamlıdır. İlgili değişken modelde yer almalıdır.

b) Tahmin edilen eğim parametresinin 0.5 olduğu hipotezini 0.5 olmadığı

alternatifine karşı %5 anlamlılık düzeyinde test edin.

Temel hipotez, alternatif hipotez

0 1

1 1

: 0.5

: 0.5

H

H

Red bölgesi 2.074t veya 2.074t ’dir. Hesaplanan test istatistiğin değeri

1 1

1

ˆ 0.310 0.052.32

ˆ 0.082( )t

Se

141

2.32 2.074t olduğu için temel hipotez 0H reddedilir.

c) Eğim Parametresinin bir %99 aralık tahminini elde edin.

1 1ˆ ˆ( ) 0.310 2.819(0.082) (0.079;0.541)ct Se

2. Aşağıda tahmin edilmiş modelde

4,20 (**)

ˆ( ) (*) (0,002)

(2.016) (4.817)

i

i

Y X

Se

t

a) (*) yerine hangi değer gelmelidir?

00

0 0

2.08ˆ 4.20 ˆ2.016 ( )ˆ ˆ)

3( (

33)

3t SeSe Se

b) (**) yerine hangi değer gelmelidir?

1 11

1

ˆ ˆˆ4.81 0.07

ˆ 0.002( )09634t

Se

142


Klasik doğrusal regresyon modelinin ilk altı varsayımının geçerli olduğu altında ve

verilen bir anlamlılık düzeyinde ana kütle parametrelerinin aralık tahminlerinin nasıl

oluşturulduğu ve yorumlandığı ele alınmıştır.

Örnek regresyon denkleminden hareket ederek ana kütle hakkında çıkarsama yapmak

amacıyla kullanılan hipotez testinin bileşenleri ve hipotez testinin nasıl uygulandığı

açıklanmaya çalışılmıştır.

143

Bölüm Soruları

1. Aşağıda verilen modelde eğim katsayısının sıfır olduğu hipotezini sıfır olmadığı

alternatifine karşı %5 anlamlılık düzeyinde test edilirse, aşağıdaki şıklardan

hangisi yanlıştır.

104.02 0.69 20

ˆ (18.62) (0.07)i

Y X n

Se

a) 0 1 1 1: 0 , : 0H H

b) Red bölgesi 2.101t veya 2.101t

c) Test istatistiği 9.857143’ e eşittir.

d) Serbestlik derecesi 18’dir.

e) Temel hipotez kabul edilir.

2. Soru 1’deki eğim katsayısının güven aralıkları aşağıdakilerden hangisidir?

a) (0.54293;1.23293)

b) (1.27450;1.59012)

c) (-0.08529; 2.7256)

d) (0.03692; 1.62491)

e) (0.59310;1.542915)

3. Aşağıdaki boşluklara hangi değerler gelmelidir?

107.93 (**)

ˆ( ) (31.503) (19.72)

(*) (2.391)

i

i

Y X

Se

t

a) *=3400,119 ; **=47.15052

b) *=47.15052 ; **=8.247595

c) *=3.426023 ; **=47.15052

d) *=3.426023 ; **=8.247595

e) *=2.965108 ; **= 54.895301

4. Aşağıdakilerden hangisi hipotez testinin bileşeni değildir?

a) Temel Hipotez H0, Alternatif Hipotez H1

b) Güven aralığının oluşturulması

c) Test İstatistiği

d) Red Bölgesi

e) Sonuç

144

5. t-dağılımı normal dağılıma göre …….., varyanslı, …….. ve ………..kuyrukludur.

a) daha büyük ; basık ; kalın

b) daha küçük; basık; kalın

c) daha büyük ; sivri; kalın

d) daha küçük ; sivri; ince

e) daha küçük ; basık; ince

6. Aşağıda sonuçları raporlanmış regresyon modelinde eğim parametresinin 0.05

anlamlılık seviyesinde güven aralığı ve tablo değeri aşağıdakilerde hangisidir?

2ˆ ˆ20.858 1.942 17 3.96

ˆ (3.05) (0.026)

t t

i

Y X n

Se

,

a)

(0.975;15) 1 (0.975;15)

(0.975;15)

1.942 0.026 1.942 0.026 1

2.131

P t t

t

b) (0.95;17) 1 (0.95;7)

(0.95;17)

1.942 0.026 1.942 0.026 1

1.740

P t t

t

c)

(0.975;15) 1 (0.975;15)

(0.975;15)

ˆ1.942 0.026 1.942 0.026 1

2.131

P t t

t

d) (0.975;17) 1 (0.975;17)

(0.975;17)

ˆ1.942 0.026 1.942 0.026 1

2.110

P t t

t

e) (0.975;17) 1 (0.975;17)

(0.975;17)

1.942 0.026 1.942 0.026 1

2.110

P t t

t

7. Temel hipotez doğru iken reddedilirse ……. yapılmış olur, bir testin …………

birinci tip hata yapma olasılığıdır.

a) ikinci tip hata; anlamlılık düzeyi

b) birinci tip hata; anlamlılık düzeyi

c) birinci tip hata; 1

d) ikinci tip hata ; 1

e) ikinci tip hata, güven aralığı

145

8. Aşağıdakilerden hangisi yanlıştır?

a) Temel ve alternatif hipotezlerde ana kütle parametresi yer alır.

b) Gelenek anlamlılık düzeyleri 0.01 , 0.05 ve 0.10’dur.

c) Çift taraflı hipotez testlerinde alternatif hipotez anakütle parametresinin sıfır veya

sıfırdan farklı bir sayıya eşit olmadığı şeklinde kurulabilir.

d) Anlamlılık testi sonucunda temel hipotez kabul edilirse ilgili değişken bağımlı

değişkeni etkilemediği sonucuna varılır.

e) Hipotez testleri sadece çift taraflı kurulur.

9. Aşağıdaki boşlukları doldurunuz.

* (0.15)

ˆ( ) (1.08) (0,002)

(2.016) (**)

i

i

Y X

Se

t

a) 1.87 ; 75

b) 2.18 ; 75

c) 0.54 ; 37.5

d) 2.18 ; 37.5

e) 0.54 ; 75


a) t- dağılımının normal dağılımdan farklı olarak serbestlik derecelidir.

b) Ana kütle hata terimi bilinmiyor ancak tahmin ediliyorsa hipotez testi için t- dağılımı

kullanılır.

c) Ana kütle hata terimi bilinmiyor ancak tahmin ediliyorsa aralık tahmini için t- dağılımı

kullanılır.

d) Aralık tahmini için nokta tahmini ve nokta tahmininin standart hatasının bilinmesi

gerekir.

e) Geleneksek anlanlılık düzeyleri (0.01, 0.05, 0.10) ikinci tip hata yapma olasılığını

gösterir.

Cevaplar

1) e

2) a

3) c

4) b

146

5) a

6) a

7)b

8) e

9) b

10) e

147

6. UYUMUN İYİLİĞİ

148


6.1. Uyumun İyiliğinin Ölçülmesi ve Önemi

6.2. Belirginlik Katsayısı

6.3. Tahminin Standart Hatası

6.4. Genelleştirilmiş 2r

149


1) Uyumun iyiliğinden ne anlıyoruz?

2) Tahmin edilen örnek regresyon doğrusunun verilere uygunluğu hakkında bilgi

veren ölçü var mıdır?

3) Uyumun iyiliği gösteren ölçülerden hangisini kullanmak daha uygundur? Neden?

150




Uyumun İyiliği Tahmin edilen regresyon

denkleminin uygunluğu için

kriterlerin neler olduğu ve

hangisinin ne sebeple tercih

edildiği

Ders notları ve uygulamalar

Toplam Değişme,

Regresyona Bağlı Kareler

Toplamı, Hataya Bağlı

Kareler Toplamı

Toplam değişme, regresyon

ile açıklanan değişme ve

regresyonla açıklanamayan

değişmenin anlamını ve

onların belirginlik katsayısı

ile nasıl ilişkili olduğunu

açıklayabilmelisiniz.

Ders notları, alıştırmaları

yeniden çözülmeli ve

mümkün olduğunca farklı

örnekler ile çalışılmalı.

Belirginlik katsayısı ve

korelasyon katsayısı

Belirginlik katsayısından

korelasyon katsayısına ve

belirsizlik katsayısına

geçebilmelisiniz.


Tahminin Standart Hatası Regresyon doğrusunun

verilere uygunluğunu tespit

etmek


151

Anahtar Kavramlar

Uyumun iyiliği

Belirginlik katsayısı

Tahminin standart hatası

Belirsizlik katsayısı

Toplam değişme

Regresyona bağlı kareler toplamı

Hataya bağlı kareler toplamı

152

Giriş

Derslerimiz ilerledikçe tahmin ettiğimiz parametreler ve regresyon modeli ile ilgili

istatistiksel büyüklüklere de ulaşıyoruz. Bu dersimize kadar bunlardan hata teriminin

varyansının, tahmin edilen parametrelerin varyanslarını ve dolayısıyla bunların karekökü olan

standart hatalarını elde ettik. Bu doğrultuda ana kütle parametreleri için aralık tahminleri

oluşturduk ve hipotez testleri uyguladık.

Bu dersimizde regresyon doğrusu uyumunun üzerinde duracağız. Regresyon doğrusu

uyumundan ne anlıyoruz? Bilindiği üzere örnek regresyon doğrusu bağımlı değişkenin tahmini

değerlerinden geçer. Peki, bu tahmin edilen değerlerin gözlemlenen değerlere göre konumu

nedir? Bağımlı değişkenin tahmin edilen değerlerinden geçen regresyon doğrusu bağımlı

değişkenin gözlemlenen (teorik) değerler ne kadar yakınsa o derece uyumludur.

Bu dersimizde regresyon doğrusunun verilere uyumunu veren ölçülerin neler olduğunu,

hangisinin niçin tercih edildiği üzerinde duracağız.

153

6.1. Uyumun İyiliğinin Ölçülmesi ve Önemi

Örneklem verileri kullanılarak tahmin edilen regresyon modelinin belirlediği regresyon

doğrusu, serpilme diyagramında gözlemlenen değerlerin arasından geçmektedir. Tahmin edilen

modelin başarısı açısından regresyon doğrusunun verilere ne kadar yakın olduğu önemlidir. Bu

bölümde regresyon doğrusunun veriler uyumunun bir ölçüsü olan belirginlik katsayısı,

tahminin standart hatası ve genelleştirilmiş r2 tanıtılacaktır.

6.2. Belirginlik katsayısı

1.Bölümden bilindiği üzere regresyon modelindeki (0 1i i iY X u ) bağımsız

değişken Xi , “açıklayıcı değişken” olarak da adlandırılmaktadır. Bunun nedeni ise Yi’deki

değişimin, Xi’deki değişim ile “açıklanacağı” varsayılmakta, tahmin problemine bağlı olarak

bağımlı değişken 𝑌𝑖’deki değişimin mümkün olduğunca büyük bir kısmını 𝑋𝑖 ’in açıklaması

arzu edilmektedir.

Yi ’deki açıklanan değişimin bir ölçümünü geliştirmek için, Yi “açıklanabilir” ve

“açıklanamayan” bileşenlerine ayrılabilir. Bağımlı değişkenin

i i iY E Y u

ile gösterimindeki birinci unsur 0 1( )i iE Y X , Yi’nin açıklanabilir “sistematik” bileşeni,

ikinci unsur iu ise Yi ‘nin açıklanamayan “rassal, sistematik olmayan” bileşenidir. Bu

parçaların her ikisini gözlemlenemezken, bilinmeyen parametreler 0 ve 1 ’yi örnek

verilerinden tahmin ederek , Yi ’nin değerini benzer şekilde aşağıdaki gibi ayrıştırabiliriz.

ˆ î i iY Y u

burada önceki derslerimizden 0 1ˆ ˆˆ

i iY X ve ˆî i iu Y Y eşitlikleri bilinmektedir.

Yi ’yi yukarıdaki gibi bileşenlerine ayrılabilmesi, EKK özelliklerinden örnek regresyon

doğrusunun “ortalamalar noktası” ,X Y noktasından geçtiği varsayımına dayanmaktadır. Buna

göre ˆ î i iY Y u denklemini her iki tarafından örneklem ortalaması Y ’yi çıkartarak aşağıdaki

gibi yazmak mümkündür.

i. gözlem için;

ˆ î i iY Y Y Y u

ˆ î i iy y u

154

Şekil 6.1 ile gösterilen iY ile ortalama değeri Y arasındaki fark ( iY Y ; regresyon

modeli ile “açıklanan” îY Y ve regresyonla açıklanamayan ( ˆ

iu ) olmak üzere iki parçadan

oluşmaktadır.

Şekil 6.1. Yi’nin açıklanan ve açıklanamayan bileşenleri

Böylece i. gözlem için iY ’deki örneklem değişim ˆ ˆ

i i iY Y Y Y u veya

ˆ î i iy y u ile gösterilir. 1 2, , nY Y Y ‘e kadar bir örnekleme sahip isek, bu örneklemenin

örneklem ortalaması Y ve örneklem varyansı 22 1y iS Y Y n olmak üzere iki

tanımlayıcı ölçüsü olduğu istatistik derslerinden bilinmektedir. Bütün örneklem için aynı

değişimin hesaplanabilmesi için 1, ,i n ’e kadar örneklem değerleri iY ’ler ile örneklem

ortalaması Y arasındaki farkların kareli toplamı 2

iY Y alınır ki; bu kareli toplam

2

iY Y , örneklem değerlerindeki toplam değişimin bir ölçüsüdür. ( Not: İstatistik dersinde

verilen aritmetik ortalamanın özelliklerinden ( ) 0i iy Y Y olduğu bilinmektedir. Bu

nedenle iy ’lerin toplamı değil, karelerinin toplamı alınmaktadır. )

ˆ î i iY Y Y Y u veya

ˆ î i iy y u

Yyukarıdaki denklemin her iki tarafının karelerinin toplamı alınır

X

Y

ˆ î iY Y y

,X YˆY Y

i iY Y y

0 1ˆ ˆY X

ˆ î iY Y u

iX

X ,i iX Y

iY

0

155

2 2

2 2 2

2 2 2 2

1

2 2 2 2

1

ˆ ˆ( )

ˆ ˆ ˆ ˆ ˆ ˆ2 0 olduğundan

ˆˆ ˆ ˆ 'den

ˆ ˆ

i i i

i i i i i i i

i i i i i

i i i

y y u

y y u y u y u

y y u y x

y x u

sonucuna ulaşılır. Burada;

2 2( )i iy Y Y = Toplam değişme olarak da adlandırılan Bütün Kareler Toplamı

(BKT)’dır. Örneklem ortalaması etrafında 𝑌’deki toplam değişimin bir ölçümüdür.

2 2 2 2

1ˆˆˆ ( )i i iy Y Y x = Regresyona bağlı Kareler Toplamı (RKT)’dır. Aynı zamanda

“regresyonla açıklanan kareler toplamı” olarak da bilinmektedir.

2 2ˆˆ ( )i iu Y Y = Hataya bağlı Kareler Toplamı (HKT)’dır. Aynı zamanda

“açıklanamayan kareler toplamı”, “kalıntı karelerinin toplamı” veya “kareli hataların toplamı”

olarak bilinmektedir

Verilen kısaltmalar kullanılarak yukarıdaki eşitlik kısaca

BKT=RKT+HKT

ile de gösterilmektedir.

Y’deki toplam değişimin, regresyon modeli ile açıklanan ve açıklanamayan olarak iki

parçaya ayrıştırılması, regresyon modeli içindeki X ile açıklanan değişmenin Y’deki değişime

oranı olan, belirleme katsayısı ( 2r -re-kare, çok değişkenli regresyonda 2R ) olarak bilinen bir

ölçümü tanımlamamıza izin verir. Şöyle ki;

2 2 2ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y

veya

2 2 2ˆ ˆ

i i iy y u

denklemlerinin her iki yanı toplam değişmeye (BKT) -2 2( )i iy Y Y - bölünürse

2 2

2 2

ˆ ˆ1

i i

i i

y u

y y

sonucuna ulaşılır. Regresyon ile açıklanabilen değişmenin toplam değişmeye oranı yukarıda da

belirtildiği üzere belirginlik katsayısına ( 2r ) eşittir.

2 2 2 2

12

2 2 2

ˆˆ ˆ( )

( )

i i i

i i i

Y Y y x RKTr

Y Y y y BKT

156

Belirginlik katsayısını Hata Kareler Toplamı (HKT) ile de göstermek mümkündür.

Bunun için

2

2

2

ˆ1

i

i

ur

y

‘den 2r aşağıdaki gibi yazılır.

2

2

2

ˆ1 1

i

i

u HKTr

y BKT

2r için yukarıda verilenlerden başka hesaplama yolları da önerilebilir. Bunun için

2 2 2 2

1ˆ

i ir x y eşitliğinin pay ve paydası n veya n-1’e bölündüğünde

2

2 2

1 2ˆ i

i

x nr

y n

elde edilir. Açıktır ki; 2

ix n terimi X bağımsız değişkeninin koşulsuz varyansına 2( )XS ,

2

iy n terimi ise Y bağımlı değişkeninin koşulsuz varyansına2( )YS eşittir. Nihayet

22 2

1 2ˆ X

Y

r


Belirginlik katsayısı (r2), örnek regresyon doğrusunun verilere uygunluğunu gösteren

bir ölçüsüdür. Bu bağlamda belirginlik katsayısı, bağımlı değişkende meydana gelen

değişmenin yüzde kaçının bağımsız değişken ve/veya değişkenlerdeki değişim tarafından

açıklanabildiğini göstermektedir.

Belirginlik katsayısı 20 1r arasında yer almaktadır. 2r , 1’e ne kadar yakınsa

örneklem değerleri ( îY ), iY değerleri ile o kadar uyumlu, dolayısıyla örnek regresyon denklemi

0 1ˆ ˆˆ

iY X ana kütle regresyon denklemine (0 1( )i iE Y X ) o nisbette yakın olacaktır.

2 1r ise, bağımlı değişkende meydana gelen toplam değişmenin tamamı (%100)

bağımsız değişken(ler)deki değişim ile açıklanmaktadır. Söz konusu durum “tam uyum” olarak

bilinmektedir. 2 0r olması ise, eğim parametresinin 1 =0 olması koşulana bağlıdır. Bu

durumda örnek regresyon fonksiyonu 0ˆˆ

iY , regresyon doğrusu ise X eksenine paralel yatay

bir doğru biçimindedir.

157

2r hangi değeri almalıdır? 2r ’yi bulma ve raporlama, değişimin farklı kaynaklarının

göreli büyüklükleri hakkında bilgi vermesine rağmen, belirli bir 2r ’nin “yeterince büyük” olup

olmadığı hakkındaki tartışmalar gereksizdir. Her ne kadar 2r nin 1’e yakın olması regresyon

doğrusunun verilere uygunluğu göstermekte ise de, zaman serisi verilerinin kullanıldığı

modellerde trendin etkisiyle yüksek 2r ’ye, yatay kesit verilerinin kullanıldığı modellerde ise

düşük 2r ’ye rastlamak mümkündür. Yatay-kesit verisi ile çalışılırsa 2r ’nin 0.10’dan 0.40’a

değerleri, çok değişkenli regresyon modelleri için bile kabul görür. Zaman boyunca çoğu kez

birlikte değişme eğilimi olan zaman-serisi verisi kullanan makroekonomik analizde 0.90 ve

daha yüksek bir 2r değerleri elde etmek mümkündür. Dolayısıyla regresyon doğrusunun

uygunluğu konusunda 2r ye göre yorum yaparken kullanılan veri türü dikkate alınmalıdır.

Dolayısıyla 2r bir istatistiktir test edilmesi gerekir. 2r ‘nin testi F-testidir ki; bu testi ilerleyen

derslerimizde öğreneceğiz. Böylece model sadece 2r ’ye göre değil, tahminlerin işaretleri ve

büyüklükleri, onların istatistiksel ve ekonomik anlamlılığı, tahminlerinin doğruluğu gibi

faktörleri dikkate alarak değerlendirilmelidir.

2r , X ve Y’ nin ölçü birimine tabi değildir. Bu özelliğiyle verilerin regresyon doğrusuna

uyumunu, gösteren aşağıda ele alınacak diğer ölçü birimlerinden tahminin standart hatasına

üstünlük sağlamaktadır.

Örnek kütle için 2r ile gösterilen belirginlik katsayı, ana kütle için

2

YX ile gösterilir.

Şimdi belirginlik katsayından belirsizlik katsayısına geçilecektir. Bunun için,

2

2

2

î

i

yr

y

’den 2 2 2ˆ

i iy r y

Ve yine

2

2

2

ˆ1

i

i

ur

y

’den 2 2 2ˆ (1 )i iu r y

eşitlikleri yazılabilir. Böylece

2 2 2ˆ ˆ

i i iy y u

eşitliği, 2r ve toplam değişme açısından yeniden aşağıdaki gibi yazılır.

2 2 2 2 2(1 )i i iy r y r y

158

Buradaki 2(1 )r belirsizlik katsayısıdır ve toplam değişmenin ne kadarının

regresyonda yer almayan değişkenler tarafından açıklanabildiğini gösterir. 2r , 1’e yaklaştıkça,

21 r ise 0’a yaklaştıkça regresyon doğrusunun verilere uyumu artacaktır.

Basit doğrusal regresyon modelinde belirginlik katsayısı ( 2r ) ve basit korelasyon

katsayısı ( XYr ) arasında ilişki vardır. Örneklem veri değerleri Xi ile Yi arasındaki doğrusal

ilişkinin varlığını gösteren örneklem korelasyon katsayısının karesi 2

XYr , basit bir regresyon

modelinde 2r ’ye cebirsel olarak eşittir (2 2

XYr r ). Böylece basit regresyonda belirginlik

katsayısından korelasyon katsayısına geçilebilmektedir.

İSPAT

Belirginlik katsayısı denklemi

2 2

12

2

î

i

xr

y

’da 1 yerine 1 2ˆ i i

i

x y

x

eşitliği yazılırsa

2

2 2

2

2

i i i i

i

x y x xr

y

elde edilir, sadeleştirme yapılırsa

2

2

2 2

i i

i i

x yr

x y

sonucuna ulaşılır ki; bu belirginlik katsayısıdır. Yukarıdaki denklemden anlaşılmaktadır ki,

basit regresyon modeli için hesaplanan belirginlik katsayısı ( 2r ) korelasyon katsayısının

karesine eşittir, dolayısıyla belirginlik katsayısının kare kökü basit korelasyon katsayısı verir. 2

XYr r

Burada üzerinde durulması gereken nokta belirginlik katsayısı 20 1r iken,

korelasyon katsayısı 1 1r değerleri arasında yer alır. Belirginlik katsayısından

korelasyon katsayısına geçerken değişken arasındaki ilişkinin yönünü gösteren korelasyon

katsayısı işaretini, regresyon modelindeki 1 ’nin işaretinden alır..

6.3. Tahmini Standart Hatası

Basit korrelasyon katsayı sıfır noktasından ve ölçekten bağımsızdır. Basit korelasyon katsayısı iki değişken

arasındaki doğrusal ilişkinin yönü ve derecesimin tespiti için kullanılır. r=0 ise iki değişken arasında ilişki olmadığı

anlamına gelmez, doğrusal ilişkinin olmadığına işarettir. Örneğin Y=X2 ilişkisinde r=0 dır. r’nin (-) veya (+) değer

alması iki değişken arasındaki örneklem ortak varyansının işaretine bağlıdır.

159

Regresyon doğrusunun verilere uygunluğunun ikinci bir ölçütü tahminin standart

hatasıdır. Örnek regresyonunun standart sapması olarak da adlandırılan tahminin standart

hatası, ana kütle hata terimi varyansı tahmininin ( 2 ) kareköküdür. Hata terimi varyansının

tahmini aynı zamanda regresyondan elde edilen bilginin bir ölçüsü olduğu için karekökü olan

tahminin standart hatası regresyonun verilere uyumunu gösterecektir. Tahminin standart hatası

aşağıdaki gibidir.

2 2ˆ ˆ( )

ˆ2 2

i i iY Y u

n n

Verilerin, regresyon doğrusu etrafındaki dağılmasının ölçüsü olan tahminin standart

hatasının ( ) büyüklüğü iY ile ˆ

iY arasındaki farkın büyüklüğüne bağlıdır. Bu farkın

2ˆ( )i iY Y küçük çıkması, îY ’ lerin verilere (

iY ) lere yaklaştığı, böylece regresyon

doğrusunun verilere uyduğunu gösterecektir.

Ancak tahminin standart hatasının uyumun iyiliği için kullanılması, aşağıda belirtilen

nedenlerden dolayı sakıncalıdır.

- Tahminin standart hatası bağımlı değişkenin ölçü birimine bağlıdır. Bağımlı değişken

ton ile ölçülür ise tahminin standart hatası küçük, kg ile ölçülür ise tahminin standart hatası

büyük çıkacaktır.

- Tahminin standart hatası, belirginlik katsayında ( 20 1r ) olduğu gibi her durum için

geçerli kesin sınırları yoktur. Regresyon doğrusunun tam uyumu durumunda, diğer bir ifade ile

örnek regresyon doğrusunun iY değerlerinden geçtiği durumda,

iY ile îY arasındaki fark sıfır

olacaktır. Dolayısıyla tahminin standart hatası için alt sınır sıfırdır. Diğer uç bir durum ise

uyumsuzlukta ise bir sınır getirilememektedir.

6.4. Genelleştirilmiş 2r

Örnek regresyon doğrusunun verilere uyumunun tespiti için bir diğer seçenek iY ’ler

ile tahmini değeri îY ’ler arasındaki ilişkinin saptanmasıdır. Bir çok durumda

2

ˆYYr olarak da

gösterilen iY ve îY arasındaki kareli basit korelasyon, uyum iyiliği için geçerli bir ölçüdür.

Burada Y ’nin bulabilecek “en iyi” öngörü olduğu varsayılır. “en iyi” öngörücü, üzerinde

düşünülen modele bağlı olarak değişebilir. Yani, genel bir uyum iyiliği ölçüsü veya genel 2r

2

2 2

ˆˆ( , )G YY

r cor Y Y r

veya daha açık bir gösterimle aşağıdaki gibidir.

160

2

2

2

ˆ 2 222

ˆ ˆ ˆ

ˆˆ ˆ

i i i i

YY

i i

i i

Y Y Y Y y yr

y yY Y Y Y

iY ile îY arasındaki basit korelasyon katsayısı ˆ1 1

YYr değerleri arasında yer

alacağı için, bu ifadenin karesi genelleştirilmiş 2

ˆYYr , 0 ile 1 arasında değer alır,

2

ˆ0 1YYr .

Genelleştirilmiş 2

ˆYYr , uygunluk katsayısı olarak da bilinmektedir.


Satış gelirleri (Y) ile reklam harcamaları(X) uygulamasında aşağıdaki veri ve ara sonuçlardan

Y X X2 XY ˆ

iY ˆî i iu Y Y 2ˆ

iu

3 1 1 3 2.2 0.8 (0.8)2

4 2 4 8 3.4 0.6 (0.6)2

2 3 9 6 4.6 -2.6 (-2.6)2

6 4 16 24 5.8 0.2 (0.2)2 8 5 25 40 7.0 1 (1)2

23i

Y

4.6Y

15i

X

3X

255

iX 81ii

Y X ˆ 23i

Y ˆ 0i

u 2ˆ 8.8iu

örnek regresyon denklemi ˆ 1.0 1.2i iY X olarak bulunmuştu.

Şimdi belirginlik katsayısı, belirsizlik katsayısı, korelasyon katsayısı ve tahminin standart

hatasını hesaplayalım. Bu uygulamada belirginlik katsayısı değişik yollardan hesaplanacaktır.

Bunlardan ilki

2

2

2

ˆ( )

( )

i

i

Y Yr

Y Y

formülünün kullanılmasıdır. Buna göre formülde yer alan unsurlardan 2ˆ( )iY Y ve

2( )iY Y değerlerinin hesaplanması gerekir.

iY îY

iY - Y 2

iY Y îY Y

2îY Y

3 2.2 -1.6 2.56 -2.4 5.76

4 3.4 -0.6 0.36 -1.2 1.44 2 4.6 -2.6 6.76 0 0

6 5.8 1.4 1.96 1.2 1.44

8 7.0 3.4 11.56 2.4 5.76

23i

Y

4.6Y

ˆ 23i

Y 0iY Y

2

23.2iY Y

ˆ 0iY Y

2

ˆ 14.4iY Y

2

2

2

ˆ( ) 14.40.62

( ) 23.2

i

i

Y Yr

Y Y

Satışlardaki toplam değişimin % 62’si bağımsız değişken reklam harcamaları tarafından

açıklanmaktadır.

Belirginlik katsayısını yukarıdaki verileri kullanarak farklı bir formül ile hesaplayalım.

161

2 2

2

2 2

ˆ ˆ( ) 8.81 1 1 0.62

( ) 23.2

i i i

i i

Y Y ur

Y Y y

Sonucun aynı olduğunu görüyoruz. Bir başka şekilde nasıl hesaplayabilirdik?

2 2 2 2

12

2 2 2

ˆˆ ˆ( )

( )

i i i

i i i

Y Y y xr

Y Y y y

Denklemdeki toplam değişme 2

iy , yukarıda 23.2 değerine eşit hesaplanmıştır. 2

1 ‘yi

hesaplamak gayet kolay olup 2

1.2 ’dir. 2

ix , 1 tahmin edilirken 10 olarak hesaplanmıştı.

Buna göre

22 2

12

2

ˆ 1.2 10 14.40.62

23.2 23.2

i

i

xr

y

yine aynı sonuca ulaşılır.

Belirginlik katsayısından satışlar ile reklam harcamaları arasındaki basit korelasyon

katsayısını hesaplayabiliriz.

2 0.62 0.79XYr r

Örneklem korelasyon katsayısı işaretini 1ˆ 1.2 ’den almıştır. 1 ’in tahmini pozitif

işaretli olduğu için XYr da pozitif işaretlilidir. Bu sonuca göre satışlar ile reklam harcamaları

arasında aynı yönde (pozitif) güçlü (0.79) bir doğrusal ilişki vardır. Basit korrelasyon

katsayısını 2 2

i i i ir x y x y formülünden hesaplanarak aynı sonuca ulaşıldığını

göstermek okuyucuya bırakılmıştır.

Belirginlik katsayısından, belirsizlik katsayısı 21 r ’yi de hesaplamak mümkündür.

Belirsizlik katsayısı 21 1 0.62 0.38r ’dir. Bu sonuca göre satışlardaki toplam değişmenin

%38’i reklam harcamaları dışındaki değişkenler tarafından açıklanmaktadır.

Regresyon denkleminin uyumunu gösteren diğer bir ölçü tahminin standart hatasıdır.

Tahminin standart hatası: 2

1 değerine eşittir.

Bu örnek ile ilgili sonuçlar aşağıdaki gibi raporlanır.

2ˆ ˆ1.0 1.2 0.62 1.71 5

( )(1.795)(0.541)

i i

i

Y X r n

Se

162

Uygulamalar

Tüketim Harcamaları ile Gelir

Örneklem 1

Örneklem 1 için aşağıdaki ara sonuçlardan

n=10 1211Y 1700iX 2 322000iX 226020i iY X 170X 121.1Y

ˆ 17.29 0.61i iY X regresyon denklemini tahmin etmiştik. Şimdi modelin belirginlik katsayısı,

belirsizlik katsayısı, korelasyon katsayısı ve tahminin standart hatasını hesaplayacağız.

Belirginlik katsayısını farklı yollarla hesaplayabileceğimizi biliyoruz. Bunlardan birini

Örneklem 1 için, bir başkasını Örneklem 2 için kullanacağız. Örneklem 1 için aşağıdaki

formülü kullanıyoruz.

2 2 2

12

2 2

ˆîy x

ry y

Öncelikle regresyon ile açıklanan değişme (RKT )2y aşağıdaki eşitlikten hesaplamamız

gerekir.

2 2 2

1ˆˆ

iy x

Yukarıdaki eşitlikte yer alan 1 bilinmekte ancak X’deki değişme 2

ix bilinmemektedir.

Öncelikle ara sonuçlardan 2

ix ’nin hesaplanması gerekir.

2 2 2 2322000 10 170 33000i ix X nX

Buradan regresyon ile açıklanan değişme:

22 2 2

1ˆˆ 0.61 33000 12279.3iy x olarak hesaplanır.

Şimdi belirginlik katsayının ikinci bileşeni toplam değişmeyi (BKT) 2y hesaplayacağız.

Toplam değişme

2 2 2y Y nY

eşitliğinden hesaplanır. Ancak yukarıdaki ara sonuçlarda gözlemlenen Y’lerin karelerinin

toplamı (2

iY ) verilmediği için öncelikle 2

iY ’nın hesaplanması gerekir.

163

ÖRNEK 1

iY 2

iY

65 4225

80 6400

79 6241

113 12769

125 15625

115 13225

144 20736

157 24649

155 24025

178 31684

2 159579iY

2 159579iY hesaplandığına göre

22 2 2 159579 10 121.1 12926.9y Y nY

Buradan belirginlik katsayısı

2 2

12

2

ˆ 12279.30.95

12926.9

ixr

y

Bu sonuca göre tüketimdeki toplam değişmenin %95’ i gelir ile açıklanmaktadır. Belirsizlik

katsayısı; 21 1 0.95 0.05r

Tüketimdeki toplam değişmenin %5’i gelir dışındaki başka değişkenler ile açıklanmaktadır.

Gelir ile tüketim arasındaki basit korelasyon katsayısı:

2 0.95 0.97r r

Korelasyon katsayısı işaretini 1 ’in işaretinden almıştır. Gelir ile tüketim arasında aynı yönde

güçlü doğrusal bir ilişki vardır.

Regresyon doğrusunun verilere uyumunu gösteren diğer bir ölçü tahminin standart hatasını

hesaplayalım.

2ˆ

ˆ2

iu

n

Burada kalıntı kareler toplamını bilmiyoruz. Ancak

2 2 2ˆ

iy y u

164

eşitliğinden hesaplayabiliriz. Buna göre yukarıda hesapladığımız değerleri yerine koyarsak;

2ˆ12926.9 12279.3 iu

Buradan

2ˆ 12926.9 12279.3 647.6iu

olarak hesaplanır ve tahminin standart hatası aşağıdaki gibidir.

2ˆ 647.6

ˆ 80.95 8.9972 10 2

iu

n

Örneklem 1 için elde edilen sonuçlar aşağıdaki gibi raporlanır.

ˆ 17.29 0.61

( ) (8.72)(0.049)

i i

i

Y X

Se

2 0.95r ˆ 8.997 10n

Not: 2 2 2

12

2 2

ˆîy x

ry y

eşitliği aynı zamanda gözlemlenen değerler ile

2 2

2

2 2

ˆˆ ( )

( )

i

i

y Y Yr

y Y Y

ile gösterilmektedir. Satış örneğinde olduğu gibi 2

2

ˆ( )

( )

i

i

Y Y

Y Y

eşitliğini kullanarak belirginlik katsayısını sizler hesaplayın.

Örneklem 2.

Örneklem 2 için aşağıdaki ara sonuçlardan

n=10 1207Y 1700iX 2 322000iX 226800i iY X 170X 120.7Y

ˆ 9.37 0.65i iY X regresyon denklemi tahmin edilmişti. Örneklem 2 için tahmin edilen

modelin belirginlik katsayısı, belirsizlik katsayısı, korelasyon katsayısı ve tahminin standart

hatasını hesaplayacağız. Örneklem 2 için aşağıdaki formülü kullanıyoruz. 2

2

2

ˆ1

i

i

ur

y

Yine burada toplam değişme 2

iy ve regresyonla açıklanamayan değişme hata kareleri

toplamı (2

iu ) bilinmemektedir. Öncelikle toplam değişmeyi (2

iy ) hesaplayalım.

2 2 2y Y nY

165

ÖRNEK 2

iY 2

iY

55 3025

74 5476

90 8100

103 10609

107 11449

135 18225

144 20736

160 25600

189 35721

150 22500

2 161441iY

22 2 2 161441 10 120.7 15756.1y Y nY

Formülde diğer bilinmeyen kalıntı kareler toplamı2

iu ’dır. Ancak 2

iu aşağıdaki eşitlikten

hesaplanabilmesi için regresyonla açıklanan değişmenin 2y hesaplanması gerekir.

2 2 2ˆ

iy y u

Regresyonla açıklanan değişme ise aşağıdaki gibidir.

2 2 2

1ˆˆ

iy x

Ancak burada da X deki değişmenin yukarıda verilen verilerden hesaplanması gerekecektir.

2 2 2 2322000 10 170 33000i ix X nX

Önemli not: Her iki örneklemde de X’ler sabit olduğu için X’dki değişmenin aynı olduğuna

dikkat edin.

Buradan hesaplamaları yapabiliriz. Regresyonla açıklanabilen değişme aşağıda hesaplanmıştır.

22 2 2

1ˆˆ 0.65 33000 13942.5iy x

Toplam değişmenin bileşenlerinden regresyon ile açıklanamayan değişmeyi bulabiliriz.

2 2 2ˆ

iy y u

215756.1 139 ˆ42.5 iu

2 15756.1 13942.5ˆ 1813.6iu

Şimdi belirginlik katsayısını hesaplayabiliriz.

166

2

2

2

1813.ˆ1 1

6

15756.8

.10 8

i

i

ur

y

Böylece tüketimdeki toplam değişmenin %88’ gelir değişkeni ile açıklanmaktadır. Belirsizlik

katsayısı; 21 1 0.88 0.12r

Tüketimdeki toplam değişmenin %12’si gelir dışındaki modele girmeyen değişkenler ile

açıklanmaktadır. Gelir ile tüketim arasındaki basit korelasyon katsayısı

2 0.88 0.94r r

Gelir ile tüketim arasında aynı yönlü güçlü doğrusal bir ilişki vardır. Tahminin stadart hatası:

2

1813.6ˆˆ 226.7 15.057

2 10 2

iu

n

olarak hesaplanır.

Not: 2 2

2

2 2

ˆ ˆ( )1 1

( )

i i i

i i

Y Y ur

Y Y y

eşitliği bilindiğine göre, gözlemlenen verilerden elde

ettiğiniz sonuçları 2

2

2

ˆ( )1

( )

i i

i

Y Yr

Y Y

denkleminde yerine koyar ve hesaplamaları yaparsanız

aynı sonuca ulaşırsınız. Lütfen bu uygulamayı sizler yapın.

Örneklem 2 için elde edilen sonuçlar aşağıdaki gibi raporlanır.

ˆ 9.37 0.65

( ) (14.02)(0.08)

i i

i

Y X

Se

2 0.88r ˆ 15.057 10n

Yukarıda aynı ana kütleden çekilen iki örneklemden siz olsanız hangisi tercih edersiniz?

Hiç kuşkusuz cevabınız 1. Örneklem olmalı. Çünkü belirginlik katsayı ve korelasyon katsayısı

2. Örnekleme göre daha büyük, belirsizlik katsayısı ve tahminin standart hatası ise daha

küçüktür.

167

Uygulama Soruları

15 yıllık verilerden İthalatın Gayrisafi Yurtiçi Hasıla ile açıklandığı modelde ˆİTH

=ithalat, GSYİH = Gayrisafi yurtiçi hasıladır. 15 yıllık verilerden elde edilen sonuçlar aşağıda

raporlanmıştır.

ˆ 2.39 0.45i iİTH GSYİH

2( ) 45.413iY Y 2ˆ 11.625iu

( )(4.12)(0.03)iSe

Aşağıdaki 1-4 arası soruları yukarıdaki verileri kullanarak cevaplandırınız.

1) Belirginlik katsayısını hesaplayarak yorumlayınız.

Yukarıdaki veriler göre belirginlik katsayısı

2

2

2

ˆ1

i

i

ur

y

veya 2

2

2

î

i

yr

y

formülleri ile hesaplanabilir. Buna göre öncelikle verilenleri yazalım.

2 2( ) 45.413i iY Y y Toplam değişme (Bütün Kareler Toplamı, BKT)

2ˆ 11.625iu Regresyon ile açıklanamayan değişme (Hata Kareler Toplamı, HKT)

Bu verilere göre ilk tahminciden 2r ‘yi bulabiliriz.

2

2

2

ˆ 11.6251 1 0.744

45.413

i

i

ur

y

veya

2

2

2

î

i

yr

y

Formülünü kullanabilmek için öncelikle 2îy ’nın hesaplanması gerekir.

BKT=RKT+HKT

2 2 2ˆ

iy y u

2ˆ45.413 11.625y

168

2ˆ 45.413 11.625 33.788y

Buradan

2

2

2

ˆ 33.7880.744

45.413

i

i

yr

y

elde edilir. Her iki hesaplama şekli de aynı sonucu vermiştir. Yorum: İthalattaki toplam

değişmenin yaklaşık %75’ i GSYİH ile açıklanmaktadır.

2) Belirsizlik katsayısını hesaplayarak yorumlayınız.

Belirsizlik katsayısı: 21 1 0.75 0.25r

İthalattaki değişmenin yaklaşık %25’i GSYİH ‘nın dışındaki değişkenler tarafından

açıklanmaktadır.

3) İthalat ile GSYİH arasındaki basit korelasyon katsayısı nedir? 2 0.75 0.87r r

İthalat ile GSYİH arasında aynı yönde güçlü doğrusal ilişki vardır.

4) Tahminin standart hatasını hesaplayınız?

2ˆ 11.625ˆ 0.946

2 15 20.894

iu

n

5) Aşağıdaki verileri kullanarak belirginlik katsayısını hesaplayınız.

( i ix X X , i iy Y Y )

2 220.04 52.85 17.94i i i ix y y x

Belirginlik katsayısını,

2

2

2

î

i

yr

y

ile hesaplayabiliriz. Burada toplam değişme olarak verilmiş, ancak 2îy İle

açıklanabilen değişme verilmemiş. 2 2 2

1ˆˆ

i iy x olduğu bilinmektedir. Yukarıdaki

verilerden öncelikle 1 ’i tahmin etmeliyiz.

1 2

17.94ˆ20.

0.89504

21i i

i

y x

x

Böylece belirginlik katsayısı

169

22 2 2

12

2 2

ˆˆ 0.89521 20.040.

52.388

530

8

i i

i i

y xr

y y

olarak hesaplanır. Yukarıdaki verilerden belirginlik katsayısı için ikinci bir yol


2 2

2

2 2

17.94

20.040.30388

52.85

i i

i i

x yr

x y

Buna göre Y’deki toplam değişmenin yaklaşık %30 X değişkeni ile açıklanmaktadır.

6) Aşağıdakilerden hangisi yanlıştır.

a. Belirginlik katsayısı sıfır ile bir arasında yer alır.

b. Belirginlik katsayısı bire eşit ise bağımlı değişkenin gözlemlenen değerleri ( iY

) ile tahmini değerleri ( îY ) çakışır ki; bu durum tam uyum olarak bilinir.

c. Tahminin standart hatası belirginlik katsayısından daima küçüktür.

d. Tahminin standart hatası bağımlı değişken iY ’nin ölçü birimine bağlıdır.

e. Genelleştirilmiş 2r , bağımlı değişkenin gözlemlenen değerleri ( iY ) ile tahmini

değerleri ( îY ) arasındaki basit doğrusal korelasyon katsayısının karesine eşittir.

7) ˆ 9.67 0.28i iÜCRET EĞİTİM 2 37.1ix

2ˆ 5.629iu n=20

( )(2.91)(0.113)iSe

Ücretlerin eğitim düzeyi ile açıklandığı model için aşağıdakilerden hangisi doğrudur.

a. Regresyonla açıklanan değişme 5.629’a eşittir.

b. Regresyonla açıklanamayan değişme yaklaşık 2.91’e eşittir.

c. Tahminin standart hatası 0.28145’e eşittir.

d. Toplam değişme yaklaşık 8.54’e eşittir.

e. Ücretlerin % 66’sı eğitim düzeyi ile açıklanmaktadır.

8) 32 yıllık veriden tahmin edilen basit bir regresyon için hesaplanan ara sonuçlar 2( ) 83iY Y ,

2ˆ( ) 45iY Y olduğuna göre aşağıdakilerden hangisi yanlıştır?

ˆ 0.89 0.0619Y X 2 0.21r ˆ 0.89

( )(0.27)(0.0291)iSe

a. Regresyon ile açıklanan değişme 38’e eşittir.

b. Belirginlik katsayısı yaklaşık 0.46’dır.

c. Tahminin standart hatası yaklaşık 1.225’dir.

170

d. Korelasyon katsayısı yaklaşık 0.68’dir.

e. Toplam değişme 83’e eşittir.

9) Aşağıdaki idaeleren hangisi doğrudur?

a. 2 2 2ˆ ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y

b. 2 2 2ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y

c. 2 2 2ˆ ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y

d. ˆ ˆ( ) ( ) ( )i i iY Y Y Y Y Y

e. 2ˆ ˆ( ) ( )i i iY Y Y Y u

Cevaplar: 6.c), 7.d), 8.d), 9.e), 10.a).

171


Regresyon doğrusunun verilere uyumunu gösteren ölçüleri detaylı olarak ele aldık.

Belirginlik katsayısının hesaplanması iin verilen alternatif formülleri kullanmak amacıyla çok

sayıda uygulama yaptık. Toplam değişme, regresyonla açıklanan değişme ve regresyonla

açıklanamayan değişme kavramlarını ve hesaplanmasını öğrendik.

172

Bölüm Soruları

1) Tahminin standart hatası ……ve……özelliklerinden dolayı uyumun iyiliğini

göstermesi açısından belirginlik katsayısına tercih edilmez.

a) Serbestlik derecesi olması; hata teriminin varyansından hesaplanıyor olması

b) Belirli alt ve üst sınırı olmaması; bağımlı değişkenin ölçü birimine bağlı olması

c) Belirli alt ve üst sınırı olmaması; serbestlik derecesinin olması

d) Her model için uygun bir ölçü olmaması; kalıntı kareler toplamından

hesaplanması

e) Belirginlik katsayısından büyük olması; her zaman hesaplanma imkânı

olmaması

2) Aşağıda verilen sonuçlara göre

2ˆ ˆ1.74 1.307 7.4 0.49 20

ˆ 6.18 2.916

i i i

i

Y X x n

Se

hangisi yanlıştır?

a) Regresyon ile açıklanan değişme 12.64’e eşittir.

b) Regresyon ile açıklanmayan değişme 4.3218’e eşittir.

c) Toplam değişme 8.3182’ye eşittir.

d) Y deki toplam değişmenin yaklaşık %75’i X değişeni ile açıklanmaktadır.

e) X ile Y arasındaki basit korelasyon katsayısı yaklaşık (-0.86)’ya eşittir.

3) Aşağıdakilerden hangisi regresyon doğrusunun uyumunu gösteren bir ölçüdür?

a) Korelasyon katsayısı

b) Belirginlik katsayısı

c) Tahmin edilen parametre

d) Ana kütle hata terimi

e) Tahmin edilen parametrenin standart hatası

4) ˆ 1.74 1.307Y X 2ˆ 15.2iu

2 31.09ix ˆ 25.92

( )(11.18)(2.099)iSe

Yukarıdaki verilere göre belirginlik katsayısının değeri nedir?

a) 0.44

b) 0.22

c) 0.61

d) 0.93

e) 0.78

173

5) Aşağıdaki verilere göre hangi ifade yanlıştır.

22 ˆ108 21i iY Y Y Y

a) Belirginlik katsayısı 0.81’e eşittir.

b) Belirsizlik katsayısı 0.19’a eşittir.

c) Toplam değişme 108’ e eşittir.

d) Regresyon ile açıklanan değişme 87’e eşittir.

e) Kalıntıların karelerinin toplamı 27’ye eşittir

6) ˆ 0.19 0.2794Y X modeli için X’in varyansı 1.2, Y’nin varyansı 0.72 ise

belirginlik katsayısı katsayısının değeri nedir?

a) 0.13

b) 0.46

c) 0.91

d) 0.63

e) 0.72

7) Aşağıdaki ifadelerden hangisi yanlıştır.

a) Genelleştirilmiş 2r , iY ile îY arasındaki basit korelasyonun karesidir.

b) Tahminin standart hatası negatif veya pozitif herhangi bir değer alabilir.

c) Basit regresyonda belirginlik katsayısının kare kökü korelasyon katsayıdır,

işareti eğim parametresinin işaretinden alır.

d) Ana kütle hata terimi varyansının karekökü tahminin standart hatasıdır.

Genelleştirilmiş 2r , belirginlik katsayısına eşittir.

8) ˆ 28.61 101.49Y X 2 96iy

2ˆ 5.7iu

( )(7.92)(14.65)iSe

Aşağıdakilerden hangisi doğrudur?

a) Y deki değişimin %94’ü X tarafından açıklanmaktadır.

b) Y deki değişimin % 0.94’ü X tarafından açıklanmaktadır.

c) Y deki değişimin % 6’sı X tarafından açıklanmaktadır.

d) Y deki değişimin %0.06 ‘sı X tarafından açıklanmaktadır.

e) Y deki değişimin %94 ‘ü X ‘i etkilemektedir.

174

9)

2

2

ˆ 3.81 1.49

( ) (7.92)(14.65)

195

ˆ 8.2

17

i

i

i

i i

Y X

Se

x

u

y x

Aşağıdakilerden hangisi yanlıştır.

a) Gözlem sayısı verilmediği için tahminin standart hatası hesaplanamaz.

b) Belirginlik katsayısı 0.98’e eşittir.

c) Regresyon ile açıklanan değişme yaklaşık 432.9’dur.

d) Toplam değişme yaklaşık 441.1’dir.

e) Basit korelasyon katsayısı yaklaşık 0.99’dur.

10) Aşağıdakilerden hangisi yanlıştır?

a) Regresyon kareler toplamı toplam değişmeden küçüktür..

b) Belirsizlik katsayısı belirginlik katsayısından kesaplanır.

c) Tahminin standart hatası ana kütle hata terimi varyansının kare köküdür.

d) Belirginlik katsayısından hesaplanan basit korelasyon katsayısı işaretini eğim

katsayısının işaretinden alır.

e) Uyumun iyiliğini gösterme açısından tahminin standart hatası belirginlik

katsayısına tercih edilir.

Cevaplar

1) b

2) c

3) b

4) e

5) c

6) a

7) b

175

8) a

9) e

10)e

176

7. UYUMUN İYİLİĞİ VE MODELLEME KONULARI

177


7.1. Orjinden Geçen Regresyon

7.2. Fonksiyonel Biçimin Belirlenmesi

7.2.1. Log-Log Model ( Tam Logaritmik Model)

7.2.2. Log-Doğrusal Model

7.2.3. Doğrusal-Log Model

7.3. Hata Terimleri için Normal Dağılım Testi : Jarque-Bera Testi

178


1) Değişkenler arasındaki ilişkiler daima doğrusal mıdır?

2) Değişkenler arasında doğrusal olmayan ilişkiler için hangi fonksiyonel kalıplar

kullanılır?

3) Hata terimi için normal dağılım varsayımını nasıl test edebiliriz?

179




Modelin Fonksiyonel Biçimi

ve Doğrusal Olmayan

Modeller

Log-log model, log-doğrusal

model ve doğrusal-log

modelin özelliklerini

anlamak ve parametrelerini

yorumlayabilmek

Ders notları ve uygulamalı

örnekler tekrar ederek

Orjinden Geçen Regresyon

Modeli

Orjinden geçen regresyonun

kendine özgü özelliklerini

öğrenmek

Ders notları

Hata Reriminin Normallik

Varsayımı

Jarque-Bera testini

uygulayabilmek

Ders notları ve uygulamalı

örnekler özümsennerek,

mümkünse çözümü yapılan

regresyon modelleri için JB

testini uygulayarak

180

Anahtar Kavramlar

Eğim

Esneklik

Değişkenin dönüştürülmesi

Log-log model

Log-doğrusal model

Doğrusal-log model

Çarpıklık

Basıklık

Jarque-Bera testi

Orijinden geçen regresyon

Ham 2r

Merkezi Limit Teoremi

181

Giriş

Regresyon modeli iktisadi bir zorunluluk varsa, sabit terim içermeyebilir. Orjinden

geçen regresyon olarak adlandırılan sabit terimsiz regresyon modeli yine EKK yöntemi ile

tahmin edilmekte ancak bu dersimize kadar özellikle üzerinde durduğumuz bazı özelliklere

sahip değildir. Bu dersimizde orijinden geçen regresyon modeli genel bir çerçevede ele

alınacaktır.

Ayrıca yine bu dersimize kadar değişkenler arasındaki ilişkilerin doğrusal olduğunu

varsaydık. Ancak tüketim, arz, talep gibi bazı iktisat teorileri için doğrusal ilişki geçerli

olmayabilir. Değişkenler arasındaki ilişki doğrusal değilse, bu tür ilişkiler için hangi fonksiyon

kalıpları uygundur ve bunların özellikleri nelerdir? Bu soruların cevabını araştıracağız.

Bilindiği üzere, regresyon modelinin tahmini sonrasında varsayımların gerçekleşip

gerçekleşmediği test edilmelidir. Bu bağlamda hata terimlerinin normal dağıldığı varsayımı test

edilecektir.

182

7.1. Orijinden Geçen Regresyon

Basit regresyon modeli bazı durumlarda aşağıdaki gibi yazılabilir.

1i i iY X u

Bu modelde sabit terim (otonom parametre, kesim parametresi) yer almamaktadır.

Regresyon doğrusu (0,0) noktasından geçmekte, bu nedenle de orijinden geçen regresyon ile

adlandırılmaktadır. Bu alt bölümde orijinden geçen regresyon modelinin tahmini ve özellikleri

üzerinde durulacaktır. Bu amaçla öncelikle örnek regresyon modelini aşağıdaki gibi yazılır.

1ˆ ˆ

i i iY X u

1 parametresinin tahmini için EKK yöntemi uygulanır. Kalıntıların kareleri toplamını

fonksiyonunda 1 ’e göre kısmi türev alınır ve sıfıra eşitlenirse, 1 parametresinin EKK

tahmincisi aşağıdaki gibidir.

1 2ˆ i i

i

X Y

X

Önemli uyarı: Yukarıdaki tahminciyi 0 1i i iY X u modelinde

1 in EKK

tahmincisi 2

1ˆ

i i ix y x ile karıştırmayın. Buradaki i ix X X , i iy Y Y iken,

orijinden geçen regresyonda 1 in EKK tahmincisinde gözlemlenen (teorik) iX ve iY yer

almaktadır.

1 ’in varyansının tahmincisi ise aşağıdaki gibidir.

2

1 2ˆ

i

VarX

Yine burada ana kütle rassal hatanın varyansı bilinmemekte, aşağıda verilen tahminci

ile tahmin edilmektedir.

2

2ˆ

ˆ1

iu

n

Sadece bir tane parametre tahmin edildiği için, serbestlik derecesi n-1’e eşittir.

Orijinden geçen regresyon modelinin sabit terimli modellerden önemli farklılıkları

vardır. Orijinden geçen regresyonda kalıntıların toplamının ( îu ) sıfır olması gerekmez.

Önemli bir diğer özelliği belirginlik katsayısının aldığı değerdir. Uyumun iyiliği ölçüsü

183

belirginlik katsayısının 0 ile 1 değerleri arasında yer alması gerektiğini önceki derslerimizde

öğrenmiştik. Bunun tek istisnası orijinden geçen regresyon olup, bu modelde belirginlik

katsayısı negatif değer alabilmektedir. Bu nedenle orijinden geçen regresyonda 2r değil, ham 2r hesaplanır ve yorumlanır. ham 2r aşağıdaki gibi tanımlanır.

2

2

2 2

i i

i i

X Yham r

X Y

ham 2r , 0 ile 1 arasında değer alır. Ancak alternatif modellerin karşılaştırılması ham 2r ile 2r

’nin mukayese edilmesi uygun değildir.

İktisadi bir zorunluluk yoksa, orijinden geçen regresyon modelin kurulması tavsiye

edilmez, çünkü 0 ’ın istatistiksel açıdan anlamsız olması, orijinden geçen bir regresyona sahip

olduğumuz anlamına gelmektedir. Ayrıca 0 ’ın modelde yer alması gerektiği halde yer

verilmemişse, bu durum model kurma hatasına sebep olacaktır.

7.2. Fonksiyonel Biçimin Belirlenmesi

Şimdiye kadar bağımlı değişken Y ile bağımsız değişken X arasında doğrusal bir

ilişkinin olduğunu varsaydık. Diğer bir ifade ile temel ekonomik ilişkiyi, doğrusal bir

fonksiyon (0 1( | )i i iE Y X X ) olarak ele aldık. Söz konusu durum ( )iE Y ve 𝑋 arasında

doğrusal, düz-doğru bir ilişkinin var olduğu anlamına gelmektedir.

Ancak bütün ekonometrik analizlerin başlama noktası iktisat teorisidir ve temel

ekonomik ilişki regresyon fonksiyonu ile doğru biçimde formüle edilmelidir. Burada

kastedilenin ne olduğunu tüketim modeli çerçevesinde inceleyelim. Diğer değişkenler sabit

iken tüketim harcaması ve gelir arasındaki ilişki hakkında iktisat teorisi gerçekte ne

söylemektedir? Tüketim harcamalarının zorunlu bir harcama olması nedeniyle, teoriye göre

gelir ile tüketim arasında pozitif bir ilişkinin olması beklenmektedir. Ancak iktisat teorisi bu

ilişkinin düz bir doğru olması gerektiğini iddia etmez. Çünkü doğrusal ilişki, hane halkı geliri

arttıkça tüketim harcamalarının aynı sabit oranda süresiz olarak artmaya devam edeceği

anlamına gelir ki; bu iktisadi gerçeklere uygun değildir. Gelir yükseldikçe, tüketim

harcamalarının artması ancak bu artışın azalan bir oranda olması beklenir. Diğer bir ifade ile

gelir artarken tüketim harcamaları da mutlak olarak artacak ancak nispi olarak yani tüketimin

gelirdeki payı azalacaktır. Böyle bir ilişki grafiksel olarak, iki değişken arasında düz-doğru bir

ilişkinin olmadığını ifade etmektedir. Doğrusal ilişkide eğim sabit olduğu için gelir arttıkça

tüketim de aynı oranda artmaktadır, marjinal etki sabittir.

184

Şekil 7.1 Tüketim harcaması ve gelir arasında doğrusal olmayan bir ilişki.

Şekil 7.1’deki gibi eğrisel bir ilişki için, açıklayıcı değişkendeki bir değişimin

marjinal etkisi belirli bir noktadaki kavise teğetin eğimi ile ölçülmektedir. X’teki bir değişimin

marjinal etkisi ( 1 1,X Y ) noktasında ( 2 2,X Y ) noktasına göre daha büyüktür. X arttıkça, 𝑌’nin

değeri artmaktadır, ancak eğim daha düşük olduğu için, bu artış “azalan oranda bir artış”

anlamındadır. Tüketim harcaması modeli için iktisadi açıdan bunu şöyle açıklayabiliriz.

Tüketim harcaması için düşük gelirlilerde marjinal tüketim eğilimi daha büyük ancak gelir

artıkça marjinal eğilim (marjinal tüketim meyli) azalmaktadır.

Basit doğrusal regresyon modeli esnek bir modeldir. X ve Y değişkenleri dönüştürülerek

doğrusal olmayan ilişkiler, doğrusal regresyon modeli çerçevesinde ele alınabilir ve

dönüştürülmüş değişkenlerin yer aldığı bu model için doğrusal regresyon modeli ile ilgili

kurallar kullanılabilir.

Değişkenler arasındaki ilişki için cebirsel bir şekil seçme, orijinal değişkenlerin

dönüşümlerinden birini seçme anlamına gelmektedir. Ekonometrik modellerde Değişken

dönüştürmeleri için doğal logaritmanın kullanımı oldukça yaygındır. Logaritmik dönüşümler

ücretler, maaşlar, gelir, fiyatlar, satışlar ve harcamalar gibi parasal değerleri olan değişkenler

ve genelde “büyüklüğü” ölçülen değişkenler için kullanılmaktadır.

Şekil 7.2 ’de yer alan grafiklerde 2X , 3X gibi kuvvet alınarak değişken

dönüştürme ve ln( )X dönüştürmeleri kullanılmıştır. Değişkenler yukarıdaki gibi

dönüştürülürse, karşılaşılan zorluk regresyon sonucunun değişik yorumlanmasıdır. Her farklı

fonksiyonel biçim için, hem eğim hem de esneklik ile ilgili ifadeler doğrusal ilişkide

olduğundan farklıdır. Çünkü değişkenler arasında doğrusal olmayan bir ilişkili vardır.

185

Şekil 7.2. Alternatif fonksiyonel şekiller.

Değişkenlerin dönüştürülmesi ile elde edilen sonuçların yorumlanması doğrusal

regresyon modelinde olduğundan farklıdır.

Logaritmik dönüşümler ile ilgili üç mümkün yapılandırma ve yorumları aşağıdaki

gibidir.

7.2.1. Log-Log Model (Tam Logaritmik Model)

Doğrusal olmayan modellerden öncelikle log-log model diğer bir ifade ile tam

logaritmik model ele alınacaktır. Log –log model aşağıdaki üstel regresyondan elde

edilmektedir. Buna göre aşağıda verilen regresyon modeli,

1

0iu

i iY X e

parametrelerinin özelliğinden dolayı doğrusal değildir. Çünkü Y ile X arasında ilişki kuran 1

parametresi değişken ile çarpılır değil, değişkenin üssü durumdadır. Ayrıca hata terimi

toplanabilir nitelikte olmayıp, çarpılır bir değer niteliğindedir. Eğer model; 1

0i i iY X u ise

hata terimi çarpılır biçimdedir. Ancak bu durumda ( ) 0iE u = varsayımı geçerli değildir.

186

1

0iu

i iY X e modelinde ise klasik doğrusal regresyon modelinin temel varsayımları

geçerliliğini korumaktadır.

2 2( ) 0 ( ) ( ) 0 için ( ) 0i i i j i iE u E u E u u i j E u X

1

0iu

i iY X e modeli her iki tarafının doğal logaritması alınarak aşağıdaki gibi de

gösterilebilir.

0 1ln ln lni i iY X u

Log-Log model ile adlandırılan bu modelin kullanılabilmesi için hem 𝑌 hem de 𝑋 ‘in

sıfırdan büyük olması gerekmektedir. Çünkü logaritma sadece pozitif sayılar için

tanımlanmaktadır. Burada * lni iY Y= ,

* lni iX X= ve *

0 0ln gösterilerek dönüştürülmüş

yeni bir model

* * *

0 1i i iY X u

elde edilir ve modele en küçük kareler yöntemi uygulanarak, parametreler (*

0 , 1 ) tahmin

edilir.

Log-Log model için iki önemli nokta vardır.

Log-Log modelde değişkenler, aritmetik değerleriyle değil doğal logaritmik

değerleriyle yer alırlar. Bu sebeple model logaritmik doğrusal veya

doğrusallaştırılmış model olarak da bilinmektedir.

Log-Log modelde 1 ’in tahmini Y’nin X’e göre sabit esnekliğini verir.

1YX

dY X

dX Y Y’nin X’e göre sabit esnekliği

Şekil 7.2 ‘e bakarak, iktisatçıların sabit esnekliği belirlemek için çok sık olarak neden

log-log model kullandığını görebilirsiniz. Panel (c) 1 1 ise ilişki bir arz eğrisini , 10 1

ise bir üretim ilişkisini gösterebilir. Panel (d)’de 1 0 ise bu ilişki bir talep eğrisini

gösterebilir. Her durum da esneklik sabit olup yorum için uygundur.

187


1 ’in, Y’nin Xi’e göre sabit esnekliğine eşit olduğunu göstermek için esneklik

formülünü yeniden yazalım.

YX

dY X

dX Y

Y fonksiyonunda X’e göre kısmi türevi alınır.

1 1 11 1

1 0 1 0 0

u u udYX e X X e Y X e

dX

için

1

1 1

YX Y

X elde edilir.

Elde edilen bu sonucu esneklik denkleminde yerine koyar ve matematiksel

sadeleştirmeleri yaparsak;

1 1YX

dY X Y X

dX Y X Y

Y’nin X1’e göre sabit esnekliğinin 1 parametresine eşit olduğu sonucuna ulaşılır.

Log-Log modelde tahmin edilen parametreler doğrusal modelde olduğu gibi eğimi

değil, esnekliği ifade ettiği için yorumları da buna bağlı olarak değişecektir. Örneğin 1

parametresi için, “X’deki %1 lik değişmeye karşılık Y ,% 1 kadar değişecektir” yorumu

yapılır.

İktisat derslerinde gördüğünüz Cobb-Douglas tipi üretim fonksiyonu log-log modele

örnek teşkil eden iktisadi bir modeldir.

uQ AK L e

Modelde Q üretim hacmi, K sermaye ve L emek değişkenleri, A ise teknoloji seviyesini

gösteren sabit parametredir. Modelin doğrusallaştırılmış biçimi;

ln ln ln lni i i iQ A K L u

ile gösterilir. ve parametrelerinin tahmini,

ˆQ K

K Q

Sermayenin marjinal verimlilik esnekliği

188

ˆ Q L

L Q

Emeğin marjinal verimlilik esnekliğinin

tahminini verir ve tahmin edilen esneklikler her noktada sabittir. Sermayedeki %1’lik değişim

üretimi % , emekteki %1’lik değişim üretimi % kadar değiştirecektir.

Bir başka örnek olarak aşağıdaki talep modelini verebiliriz.

1 2

0

u

X XD P Y e modelinde D, X malının talebini P, X malının fiyatını, Y ise X malını

talep edenlerin ortalama gelirini ifade etmektedir.

Modelin parametreleri;

1ˆ X X

X X

D P

P D

Talebin Fiyat esnekliği

2ˆ X

X

D Y

Y D

Talebin Gelir esnekliğinim

tahminini verir.

Log-log fonksiyonel şekil, çoğunlukla talep denklemleri için kullanılmaktadır.

𝑃 =Tavuk reel fiyatı (lira) 𝑄 =Kişi başına tavuk tüketimi, (kilo), için 52 gözlem Şekil

6.16’da gösterilmektedir. Bu, Şekil 4.5(d)’de gösterilen karakteristik hiperbolik şekil

göstermektedir.

Şekil 7.3 Tavuğun Miktar ve Fiyatı

Tahmin edilmiş log-log model :

189

ˆln( ) 2.72 1.38ln( )

ˆ( ) (1.04) (0.05)i

Q P

Se

Regresyon modelin sonucuna göre fiyattaki %1’lik bir artış tavuk tüketim miktarını

%1.38 azaltacağı tahmin edilmektedir. Talebin fiyat esnekliğinin 1.38 olduğu tahmin edilmiştir.

7.2.2. Log-Doğrusal Model

İktisatta alanında GSMH, dış ticaret açığı, cari açık, para arzı gibi iktisadi

büyüklüklerin büyüme oranları önemli göstergelerdir. Ekonometrik analizlerde iktisadi

büyüklüklerin üyüme oranını tahmin etmek için Log-doğrusal model kullanılmaktadır.

Log_doğrusal model,

0 1lnY X

ile gösterilmektedir. Model sol tarafta logaritmik bir terime ve sağ tarafta ise dönüştürülmemiş

(doğrusal) bir değişkene sahiptir. Kısaca sadece bağımlı değişken logaritması alınması suretiyle

dönüştürülmüş bir değişkendir. Bağımlı değişkeni bu şekilde kullanılabilmesi sıfırdan büyük

olmasını gerektirmektedir, 0Y .

Log-doğrusal fonksiyon

0 1X

iY e

ile gösterilen üstel bir fonksiyon olup, bu fonksiyonun her iki tarafının doğal logaritması

alınması suretiyle 0 1lnY X biçimine dönüşmüştür.

Log-dog model için her noktadaki eğim 1Y olup , 1 0 olması Y’nin daha büyük

değerleri için marjinal etkinin arttığı anlamına gelmektedir. Fonksiyonda marjinal etki artan bir

oranda artmaktadır.

Log-doğrusal modelin şekilleri Şekil 7.2 (e)’de gösterilmektedir. ve fonksiyonun türevi

ve esnekliği Tablo 4.1’de verilmektedir. Log-doğrusal modelde 1 , ln Y nin X’e göre türevidir

1

ln 1 1 'deki nisbi değişme

ln 'deki mutlak değişme

d Y X dY dY Y

dX Y Y dX Y dX X

190

ve esneklik

1X ’e eşittir.

Modelin yorumu logaritmanın özellikleri kullanılarak elde edilebilmektedir. Log-

doğrusal modelde, X ’teki bir birimlik artış, Y’de yaklaşık olarak % 1 bir değişime yol

açmaktadır.

Y’deki % 1 ‘lik değişme 100 ile çarpılırsa, X’deki 1 birimlik değişmeye karşılık Y’deki

yüzde değişme ya da büyüme oranı elde edilir.

Şekil 7.2 ‘de mümkün şekiller yer almaktadır. 1 0 ise fonksiyon artan bir oranda

artmaktadır 1 0 ise, fonksiyon azalan bir oranda azalmaktadır.


Yukarıdaki 1

1dY

Y dX eşitliğinden;

1

YY

X

elde edilir. Esneklik denkleminde dY dX yerine 1Y yazılır ve

sadeleştirmeler yapılırsa,

1 1YX

Y X XY X

X Y Y

sonucuna ulaşılır. Böylece Log-Doğrusal modelde

esneklik 1X ’e eşittir.

Log-doğrusal modelde özel olarak eğim, örneklem ortalaması Y ile, esneklik ( 1ˆ X )

ise örneklem ortalaması X ile değerlendirilebilmektedir.

Büyüme modelleri log-doğrusal modellere iyi bir örnek teşkil etmektedir. Teknolojik

gelişmelere bağlı üretilen buğday veriminin (hektar başına ton) her yıl yaklaşık olarak sabit bir

oranda arttığını varsayalım. 𝑡 yılındaki verimin, 1 yılda sabit büyüme oranı olan g ile

1(1 )t tVERİM g VERİM

olduğunu varsayalım. Tekrarlı yerine koyma işlemi ile 0(1 )t

tVERİM g VERİM elde edilir.

Burada 0VERİM örneklem başlamadan önceki yıl olan “0” yıldaki verimdir, böylece bu

muhtemelen bilinmemektedir. t ise zamanı t=1,2,3,….,T göstermektedir.

191

0(1 )t

tVERİM g VERİM

Denkleminin her iki tarafının logaritması alınarak

0ln ln ln 1tVERİM VERİM g t

0 1ln tVERİM t

elde edilir. Model, bağımlı değişkeni ln tVERİM bağımsız değişkeni ise zaman (t) olan

basit bir log-doğrusal modeldir. ln tVERİM geometrik dizi iken, t (=1,2,3,….) zamanı

gösterdiği için aritmetik seri özelliği taşır.

Büyümenin pozitif olması beklendiği için 1 0 ‘dür. İlişkinin grafiği, Şekil 7.2(c)’teki

gibi yukarı-eğimli eğriye benzemektedir.

Verim için log-doğrusal model tahmini aşağıdaki gibi ise, modelin parametrelerini

yorumlayalım.

ln 0.381 0.0181

ˆ( ) (0.0419)(0.0023)

t

i

VERİM t

Se

Tahmin edilmiş katsayı 1ˆ ln(1 ) 0.0181g ’dir. Ancak amacımız ln(1 )g ’yi

değil, g’yi tahmin etmektir. Bunun için 0.0181’in anti log’u alınır 1+g= 1.01826 ve bu değerden

1 çıkarılırsa g 0.01826 olarak tahmin edilir. Buna göre buğday verimindeki büyüme oranının

verinin dönemi boyunca yılda yaklaşık olarak �� = 0.01826 veya yaklaşık %1.82 olduğunu

tahmin etmekteyiz.

7.2.3. Doğrusal-log Model

Doğrusal-log modelin sol tarafında doğrusal, dönüştürülmemiş bir terim ve sağ

tarafında logaritmik bir terim yer alır ve

0 1 ln( )Y X

ile gösterilir. Logaritmanın özelliğinden dolayı, bu fonksiyonda 0X olması gerekmektedir.

1 ’in işaretine bağlı olarak artan veya azalan bir fonksiyondur. Fonksiyonda X’in

Y’ye göre marjinal etkisi (eğim);

192

1dY dX Y X X

olup, X arttıkça mutlak olarak azalmaktadır. Böylece eğim (marjinal etki) her noktada

değişmektedir. 1 0 ise fonksiyon azalan bir oranda artmakta, 1 0 ise, fonksiyon azalan bir

oranda azalmaktadır. Fonksiyon şekilleri Şekil 7.2 (f)’te gösterilmektedir.

Esneklik ise1 Y ’e eşit olup Y’nin aldığı her değere göre değiştiği görülmektedir.

İSPAT (Okuyucunun İsteğine bağlı)

Esneklik ise 1dY dX X ’den aşağıdaki gibidir.

1 1YX

Y X X

X Y X Y Y

Bu aşamada Doğrusal –log model için tüketim örneği verilecektir

Gelir (Y-1000lira) artarken tüketimin harcamalarının (C-100 lira) azalarak artması, gelir

ile tüketim harcamaları ilişkinin doğrusal-log denklemi ile araştırılmasını gerektirir. Buna göre,

doğrusal-log tüketim modeli aşağıdaki gibidir.

0 1 ln( )i i iC Y u

1 0 ise bu fonksiyon azalan bir oranda artacaktır. Buna göre gelir (Y) artarken

eğim 1 Y azalmaktadır. Bu bağlamda eğim, ek gelirden tüketim için marjinal harcama

eğilimidir. Benzer şekilde, esneklik 1 C olup, tüketim harcamasının daha büyük düzeyleri

için bu değer daha küçüktür. Bu sonuçlar yüksek gelirler ve büyük tüketim harcamalarında,

gelirde bir artışın etkisinin tüketim harcaması üzerine etkisinin küçük olduğu iktisat teorisi ile

tutarlıdır.

Aşağıda tüketim harcamaları için tahmin edilmiş doğrusal-log modeli verilmiştir.

ˆ 34.8 117.94ln( )

ˆ( ) (26.14)(31,09)

i i

i

C Y

Se

doğrusal-log model, tüketim üzerine ek geliri harcamak için marjinal eğilimin azalmasını

bekleyen teorik modelimiz ile tutarlıdır. 1,000 lira haftalık harcanabilir geliri olan bir hane

halkının 100 liralık bir ek gelirden tüketim için 11.794 ek harcama yapacağı tahmin edilmiştir.

oysa haftada 2,000$ gelirli bir hane halkının ek 100$ bir gelirden ek bir 6.62$ harcayacağını

tahmin etmekteyiz. Gıda harcaması üzerine gelirin marjinal etkisi gelirin daha yüksek

düzeylerinde daha küçüktür. Bu, 100$’lık gelirde bir değişimin marjinal etkisi gelirin bütün

193

düzeyleri için 10.21$ olduğunda orijinal olarak tahmin ettiğimiz doğrusal, düz-doğru ilişkiden

bir değişimdir.

Alternatif bir yorum ; gelirdeki %1 bir artışın haftada yaklaşık olarak 1.17 lira tüketim

harcamasını arttıracaktır, veya gelirdeki %10 ‘luk bir artış tüketim harcamasını yaklaşık 11.79

lira arttıracaktır. Bu yorum, gıda harcaması üzerine gelirin azalan marjinal etkisini belirtmek

için uygun basit olmasına rağmen, her ne kadar ima edilse de biraz gizlidir. Haftada 1,000$

gelirde, %10 bir artış 100$ iken 2,000$ gelirde %10 bir artış 200$’dır. Gelirde daha büyük bir

dolar artışı gelirin daha yüksek düzeylerinde gıda üzerine ek bir 13.22$ harcama meydana

çıkarması için gereklidir.

Tablo 7.4 Bazı Yararlı Fonksiyonlar, onların Türevleri, Esneklikleri ve Diğer Yorumu

Bağımlı ve bağımsız değişkenlerin farklı dönüştürmelerini kapsayan ve bunlardan

bazıları benzer şekillere sahip olan alternatif modeller verilmişken, bir fonksiyonel şekli

seçmek için kural nedir? Uygun ekonometrik modelin fonksiyonel şekli;

1. İktisat teorisinde belirtilen ilişki ile tutarlı olmalıdır.

2. En küçük kareler tahmin edicilerinin arzu edilen özelliklere sahip olabilmesi için 1-

6 varsayımları sağlamalıdır.

3. Veriye uyumunu sağlayacak esnek bir yapı olmalıdır.

Ekonomik değişkenler arasında “gerçek” fonksiyonel ilişki asla bilinmediği için seçilen

fonksiyonel şekil ne kadar iyi olursa olsun sadece bir yaklaşmadır.

194

7.3. Hata Terimleri için Normal Dağılımın Testi: Jarque-Bera Testi

Parametreler için hipotez testleri ve aralık tahminlerinin, hataların normal dağıldığı

varsayımına dayandığını önceki derslerimizden biliyoruz. Hata teriminin normal dağıldığı

varsayımı çoğu zaman gerçekleşmesi beklenen bir varsayımdır. Bunun nedeni; hata terimlerinin

genellikle modele dahil edilmeyen çok sayıda bağımsız değişkenin etkisini temsil etmesidir.

Hata teriminin modelde yer almayan değişkenlerin bileşik etkisini yansıtmakta ve bu

etkinin rassal olması beklenmektedir Merkezi Limit Teoremine (MLT) göre, rastlantısal

değişkenlerin sayısı artarken dağılımları ne olursa olsun toplamları normal dağılıma

yaklaşacaktır. MLT’ye göre, örnek birim sayısının artması halinde, Y’ler normal dağılmasa bile,

parametre tahminleri asimptotik olarak normal dağılacaktır.

Büyük örneklemlerde MLT den dolayı hataların normal dağıldığı varsayımı yerine gelse

de, regresyon hatalarının normal dağılıma uygun olması arzu edilen bir özelliktir.

Hatalar normal olarak dağılmazlar ise, alternatif bir fonksiyonel şekil veya bağımlı

değişken dönüştürmesini dikkate alarak model iyileştirilebilir.

Gerçek rassal hatalar gözlemlenemediği için, normallik testinde EKK kalıntıları

kullanılmaktadır.

Normallik varsayımının testi için bir çok test vardır. Normallik için kullanılan

testlerden Jarque-Bera testi çarpıklık ve basıklık ölçülerine dayanmaktadır. Jarque-Bera

testinde EKK kalıntılarından hesaplanan eğiklik ve basıklık ölçüleri kullanılmaktadır. Normal

dağılım simetrik bir dağılım olduğu için çarpıklık (S) 0, basıklık (K) 3’e eşittir.

Jarque-Bera (JB) test istatistiği kalıntıların normal dağıldığı temel hipotezi alında

çarpıklık ve basıklık ölçülerinden aşağıdaki gibi hesaplanmaktadır. Çarpıklığın büyük değerleri

ve/veya 3’ten oldukça farklı basıklık değerleri Jarque-Bera istatistiğinin büyük bir değerine yol

açacaktır.

222

2

3

6 24

KSJB n

Kalıntılar normal dağılırsa Jarque-Bera istatistiği iki serbestlik derecesi ile bir ki-kare

dağılımına sahiptir. İstatistiğin hesaplanan değeri iki serbestlik derecesi ile ki-kare

dağılımından seçilen bir kritik değeri büyük ise hataların normal dağıldığı temel hipotezi

reddedilir İki serbestlik derecesi ile bir 𝜒2 −dağılımından %5 kritik değer 5.99’dur ve %1

kritik değer 9.21’dir

JB test istatistiğinde yer alan eğiklik (S) ve basıklık (K) ölçüleri momentler yoluyla

hesaplanır.

195

333

ˆS

, 4

44

ˆK

MOMENTLER

İstatistik derslerinizden momentler konusunu hatırlayacak olursanız, ortalaması

olan X değişkeninin momentleri aşağıdaki eşitlikten hesaplanmaktadır.

0,1,2,3,4r

r E X r

Buna göre 0., 1., 2.,3. ve 4. momentler aşağıdaki gibidir.

0

0 1E X

1

1 E X E X

2 2

2 XE X

3

3 E X

4

4 E X

Momentler ölçü birimine bağlı oldukları için JB tets istatistiğinde çarpıklık ve basıklık

ölçüleri olarak ölçü birimlerinin etkisi giderilmiş (S ve K) momentleri kullanılmaktadır2.

E(u)=0 hata terimlerinin beklenen değeri sıfır olduğu ve aynı zamanda hata terimlerinin

yerine kalıntıların ikame edilebileceği göz önüne alınacak olursa momentler aşağıdaki gibidir.

2

2

2

îu

n

,

3

3

îu

n

,

4

4

îu

n

JB testi için emel ve alternatif hipotez aşağıdaki gibidir.

H0: S=0 ve K=3 (Kalıntılar normal dağılıma uygundur.)

H1: S 0 ve/veya K 3 (Kalıntılar normal dağılıma uygun değildir.)

Hesaplanan test istatistiği 2 sd’li ki-kare tablosu ile karşılaştırılır. Hesaplanan test

istatistiği tablo değerinden küçükse H0 hipotezi, büyükse H1 hipotezi kabul edilir. Tam

2 Yukarıdaki eşitliklerden görüldüğü üzere 0. Moment 1’e, 1. Moment X’in ortalamasına, 3. Moment X’in

varyansına eşittir.

196

logaritmik modellerde (log-log modeller) JB testi uygulanırsa kalıntıların antilogaritmaları

alınır.

Aşağıda raporlanmış sonuçlara göre kalıntıların normal dağılıma uygun olduğu

varsayımının testinin aşamalarını birlikte görelim.

2ˆ 52.35 0.138 14 39.023 0.82

(37.285) (0.0187)

0.989512 3.5452

i iY X n r

S K

Temel ve alternatif hipotezler

H0: S=0 ve K=3

H1: S 0 ve/veya K 3

Test istatistiği

2 2 2 2( 3) (0.989512) (3.5452 3)14

6 24 6 24

S KJB n

2.458JB

Tablo değeri

2

2 5.99

Karar

2

22.458 5.99JB için kalıntıların normal dağıldığı temel hipotezi reddedilemez.

197

Uygulamalar

1. 𝑃 =Tavuk reel fiyatı (lira)

𝑄 =Kişi başına tavuk tüketimi, (kilo),

için 52 gözlem Şekil 7…gösterilmektedir. Bu, Şekil 4.5(d)’de gösterilen karakteristik

hiperbolik şekil göstermektedir.

Şekil 7… Tavuğun Miktar ve Fiyatı

Tahmin edilmiş log-log model :

ˆln( ) 2.72 1.38ln( )

ˆ( ) (1.04) (0.05)i

Q P

Se

Regresyon modelin sonucuna göre fiyattaki %1’lik bir artış tavuk tüketim miktarını

%1.38 azaltacağı tahmin edilmektedir. Talebin fiyat esnekliğinin 1.38 olduğu tahmin edilmiştir.

2.Çalışma ekonomisinde ücretler ve eğitim arasındaki ilişki en çok araştırılan konudan.

birisidir. Eğitimin her bir yılı için getiri oranının sabit bir 𝑟 olduğunu varsayalım. Yani, ilk

yıldaki ücret oranı 0ÜCRET ise, ücret eğitimin ek bir yılından sonra başlangıç değeri 0ÜCRET

’dan 1 0(1 )ÜCRET r ÜCRET ’a yükselmektedir. Ekstra iki yıllık bir eğitim için

2

2 0(1 )ÜCRET r ÜCRET ve benzeri olmaktadır. ln( )ÜCRET ve eğitim yılları (EY)

arasındaki bu ilişki için aşağıdaki model kurulur

0(1 )EY

tÜCRET r ÜCRET

buradan

0ln ln ln 1tÜCRET ÜCRET r EY

198

0 1ln tÜCRET EY

Eğitimin ek bir yılı için ücretlerde yaklaşık 1ˆ%100 ‘lük bir artışa yol açmaktadır.

Aşağıdaki gibi tahmin edilen modeli yorumlayalım.

ln 2.203 0.078

( ) (0.087) (0.001)

t

i

ÜCRET EY

SE

Tahmin edilmiş katsayı 1ˆ ln(1 ) 0.078r ’dir. 0.078’in anti log’u alınır

1+r=1.0822 değerine ulaşılır. 1.0822’den 1 çıkarılırsa r, 0.0822 olarak tahmin edilir.

Bu sonuca göre eğitimin ek bir yılı ücret oranını yaklaşık olarak %8 arttırdığı tahmin

edilmektedir.

3.Tahmin edilen regresyon modelinden aşağıdaki ara sonuçlar hesaplanmıştır.

2ˆ 24.649iu , 3ˆ 89.908iu ,

4ˆ 414.816iu n=13

Kalıntıların normal dağıldığı hipotezini test ediniz.

Bu uygulamada bir önceki uygulamadan farklı olarak JB test istatistiğindeki çarpıklık

(S) ve basıklık (K) ölçüleri verilmemiştir. S ve K ölçüleri yukarıdaki kalıntılar ile ilgili ara

sonuçlarda hesaplanabilir.

Eğiklik: 3

3

ˆS

Basıklık: 4

4

ˆK

Öncelikle eğiklik ve basıklık ölçülerinde yer alan 3. Moment ( 3 ) ve 4. Moment ( 3 )

‘in hesaplanması gerekir. Ayrıca 3 ve 4 hesaplanabilmesi için varyansa eşit olan 2.

Momentin ( 2 ) de hesaplanması gerekir.

2

2

2

ˆ 24.649ˆ 1.896

13

iu

n

3

3

ˆ 89.908ˆ 6.916

13

iu

n

4

4

ˆ 414.816ˆ 31.909

13

iu

n

199

Yukarıdaki sonuçlara göre 2. Moment ( 2 ) 1.896 ‘ya eşittir. Buna göre kalıntıların

varyansı 2 1.896 ’ eşittir. Buradan 3 ve 4 hesaplanır.

2 1.896 ise 1.377

3 2 1 1.896 1.377 2.611

3 2 2 1.896 1.896 3.594

Bu aşamada eğiklik (S) ve basıklık (K) ölçüleri hesaplanabilir.

Eğiklik: 3

3

ˆ 6.9162.649 0

2.611S

Sağa çarpık

Basıklık: 4

4

ˆ 31.9098.879 3

3.594K

Sivri

Bilinmeyenler hesaplandığına göre, JB testini uygulayabiliriz.


H0: S=0 ve K=3

H1: S 0 ve/veya K 3

Test istatistiği

2 2 2 2( 3) (2.649) (8.879 3)13

6 24 6 24

S KJB n

33.905JB

Tablo değeri

2

2 5.99

Karar

2

233.905 5.99JB için alternatif hipotez kabul edilir, kalıntıların normal

dağılıma uygun değildir.

200

Uygulama Soruları

1) Orjinden geçen regresyon modeli için aşağıdaki ifadelerden hangisi yanlıştır.

a) Sabit terim yer almaz.

b) Belirginlik katsayısı negatif çıkabilir.

c) Kalıntıların toplamının sıfır olması gerekmez.

d) Uyumun iyiliği için ham 2r hesaplanır. ham 2r 0 ile 1 arasında değer alır.

e) Alternatif modellerin seçiminde ham 2r , 2r ’den büyükse orjinden geçen

regresyon tercih edilir.

2) 493i iX Y , 2 638iX verilerini kullanarak 1

ˆî iY X modelini tahmin

ediniz.

a) ˆ 0.77i iY X

b) ˆ 1.29i iY X

c) Yukarıdaki veriler modelin tahmini için yetersizdir.

d) ˆ 6.19i iY X

e) ˆ 40.85i iY X

3) ˆln 8.75 0.83lnY X modelinin yorumu aşağıdakilerden hangisidir?

a) Ln X’deki %1’lik değişme ln Y’yi % 83 düşürür.

b) X’deki %1 birimlik değişme lnY’yi % 0.83 birim düşürür.

c) X’deki %1’lik değişme Y’yi % 0.83 düşürür.

d) X’deki %1 birimlik değişme Y’yi % 83 birim düşürür.

e) X’deki 1birimlik değişme Y’yi % 83 birim düşürür.

4) ˆln 2.65 0.61Y X modelinin yorumu aşağıdakilerden hangisidir?

a) X’deki 1 birimlik değişme Y’yi % 0.61 arttırır.

b) X’deki 1 birimlik değişme ln Y’yi % 0.61 arttırır.

c) X’deki 1 birimlik değişme Y’yi % 61 arttırır.

d) X’deki % 1 birimlik değişme ln Y’yi % 0.61 arttırır.

e) Ln X’deki 1 birimlik değişme ln Y’yi % 0.61 arttırır.

5) Jarque-Bera istatistiği için aşağıdakilerden hangisi yanlıştır?

a) Test istatistiği 2 serbestlik derecesiyle ki-kare dağılımına uygundur.

b) Hata terimlerinin normal dağıldığı varsayımının testi amacıyla kullanılır.

c) Çarpıklık ve basıklık ölçülerine dayanmaktadır.

d) Test istatistiği momentlerden hesaplanır.

e) Temel hipoteze göre basıklık 3’e, çarpıklık 0’a eşittir.

6) ln ln lni i iY X u model için aşağıdakilerden hangisi yanlıştır?

a) EKK tahmincileri ile ile ’in doğrusal, sapmasız ve en iyi tahmin edicileridir.

201

b) ˆln sapmasız olduğu halde, logaritmik dönüşümü sapmalı ancak tutarlı bir

tahmindir.

c) X artarken Y azalarak artıyorsa parametresi 0’dan küçüktür.

d) Tahmin edilen parametre ( ) esnekliği verir.

e) Esneklik her noktada sabittir.

7) ln lni i iY X u modeli için aşağıdakilerden hangisi yanlıştır.

a) 0 ise marjinal etki artan oranda artmakta, 0 azalan oranda azalmaktadır.

b) X’deki bir birimlik değişme Y‘de yaklaşık % kadar bir değişime neden olur.

c) % lık değişme 100 ile çarpılırsa Y’nin büyüme oranı elde edilir.

d) Esneklik iY eşittir.

e) , Y’deki nisbi değişmenin X’deki mutlak değişmeye oranıdır.

8) Q üretimi göstermek üzere yıllık verilerden ln 5.112 0.062Q t tahmin edilen

modelde ln(1 ) 0.062r olup, 0.062’nin anti logu 1.064’e eşittir.

Aşağıdaki ifadelerden hangisi doğrudur?

a) Üretim yılda ortalama % 6.4 artmaktadır.

b) Üretim yılda ortalama % 62 artmaktadır.

c) Üretim yılda ortalama % 10.64 artmaktadır.

d) Üretim yılda ortalama % 6.2artmaktadır.

e) Üretim yılda ortalama % 106. 4 artmaktadır.

9) lni i iY X u modeli için aşağıdakilerden hangisi yanlıştır.

a) X>0 olmalıdır.

b) Marjinal etki her noktada değişmektedir.

c) >0 ise artan oranda azalmaktadır.

d) X’deki %1’lik değişme karşısında Y , kadar değişecektir.

e) <0 ise azalan oranda azalmaktadır

10) Aşağıdakilerden hangisi Jarque-Bera test istatistiğinin temel ve alternatif

hipotezlerdir? S= çarpıklık K=basıklık

a) H0: S=0 veya K=3 ; H1: S 0 veya K 3

b) H0: K=0 veya S=3 ; H1: K 0 veya KS 3

c) H0: S=0 veya K=3 ; H1: S 0 ve K 3

d) H0: S=0 veya K=3 ; H1: S 0 ve/veya K 3

e) H0: S=0 ve K=3 ; H1: S 0 ve/veya K 3

Cevaplar: 1.e), 2.a), 3.c), 4.a), 5.d), 6.c), 7.d), 8.a), 9.c), 10.e)

202


Doğrusal regresyon modeli her iktisadi ilişkiye uygunluk göstermez, dolayısıyla

alternatif model spesifikasyonlarının kullanılması gerekir. Bu bölümde alternatif modellerden

orjinden geçen regresyon, log-log model (tam logaritmik model) , log-doğrusal model, doğrusal

log modelin özelliklerini ele aldık. Bu modellerin özelliklerini inceledik. Özellikle log-log

model, log-doğrusal model, doğrusal log modelin parametrelerinin matematisel anlamı ve buna

bağlı olarak parametrelerin yorumları doğrusal modelden farklılık arz ettiğinin üzerinde

durduk.

Ayrıca hata teriminin normal dağıldığı varsayımı parametrelerin güven aralıklarının

oluşturulması ve hipotez testleri uygulamasında önem arz ettiği için, hata terimlerinin normallik

varsayımının testi için, JB testinin uygulamasını öğrendik.

203

Bölüm Soruları

1) ˆ 1.56 iY X şeklinde tahmin edilen regresyon modeli ile ilgili ara sonuçlar:

2

18627i iX Y 2 509iY

2 72iX olduğuna göre veriler uyumunu veren

ölçünün değeri aşağıdakilerden hangisidir?

a) 2 0.94r

b) 2 0.05r

c) 2 0.52ham r

d) 2 1.98ham r

e) Yukarıdaki veriler yetersizdir, hesaplanamaz.

2) Orijinden geçen regresyon modelini sabit parametreli regresyon modelinden

ayıran özelliklerden biri aşağıdakilerden hangisidir.

a) Sabit terimi istatistiksel açıdan anlamsızdır.

b) İktisadi bir zorunluluk yoksa orijinden geçen regresyon tercih edilmez.

c) Modelin parametrelerinin yorumu farklıdır.

d) Belirginlik katsayısı negatif çıkabilir.

e) Kalıntı kareler toplamı negatif çıkabilir.

3) “ X’deki %1’lik artış Y’yi % 0.02 düşürür” yorumu aşağıda tahmin sonuçları

verilen regresyon modellerinden hangisine aittir.

a) ˆln 0.81 2lnY X

b) ˆ 0.81 0.02Y X

c) ˆ 0.81 0.02lnY X

d) ˆln 0.81 0.0002lnY X

e) ˆln 0.81 0.02lnY X

204

4) S=4.307, K =6.721, n=34 ise aşağıdakiler den hangisi hata teriminin normal

dağılımının test istatistiğinin değeri ve kararıdır.

a) JB=82.504; 0H kabul; hata terimleri normal dağılıma uygundur.

b) JB=124.723; 1H kabul; hata terimleri normal dağılıma uygun değildir.

c) JB=21.084; 1H kabul; hata terimleri normal dağılıma uygun değildir.

d) JB=3.222; 0H kabul; hata terimleri normal dağılıma uygundur.

e) JB=0.06; 0H kabul; hata terimleri normal dağılıma uygun değildir.


a) Birinci moment 1’e, ikinci moment ortalamaya, üçüncü moment varyansa eşittir.

b) Çarpıklık ve basıklık ölçüleri momentlerden hesaplanır.

c) Momentler ölçü birimine bağlıdır.

d) Tahmin edilen modelin kalıntıları ile ilgili 2

iu , 3îu ve

4

iu ’nın hesaplanmış

değerlerine sahip isek JB test istatistiğini hesaplayabiliriz.

e) JB test istatistiği 2 serbestlik dereceli ki-kare tablo değerinden büyük ise

kalıntılar normal dağılıma uygunluk göstermektedir.

6) Aşağıdakilerden hangisi doğrudur?

a) Log-log modelde esneklik sabittir.

b) Log –doğrusal modeller bağımlı değişkenin büyüme oranının tahminde

kullanılabilir.

c) Log-doğrusal modelde marjinal etki sabittir.

d) Doğrusal-log modelde esneklik bağımlı değişken Y’nin değerine bağlıdır.

e) Doğrusal-log modelde marjinal etki sabit değildir.

205

7) Y , GSYİH göstermek üzere yıllık verilerden ln 0.83 0.09Y t tahmin edilen

modelde ln(1 ) 0.09r olup, 0.09’nin anti logu 1.094’e eşittir. Aşağıdaki ifadelerden

hangisi doğrudur?

a) Büyüme oranı % 9

b) Büyüme oranı % 10.94

c) Büyüme oranı % 10

d) Büyüme oranı % 9.4

e) Büyüme oranı % 0.09

8) JB test istatistiği sonucuna göre aşağıdakilerden çıkarımlardan hangisi

yanlıştır.

a) Temel hipotez kabul edilirse, hata terimleri normal dağılır, bağımlı değişkenin de

normal dağıldığı sonucuna ulaşılır.

b) Temel hipotez kabul edilirse, hata terimleri normal dağılır tahmin edilen

parametrelerin de normal dağıldığı sonucuna ulaşılır.

c) Alternatif hipotez kabul edilirse, tahmin edilen parametrelerine uygulanan güven

aralıkları ve hipotez testleri geçersizdir.

d) Temel hipotez kabul edilirse, hata terimleri serisinin çarpıklığı 3, basıklığı 0’dır.

e) Klasik doğrusal regresyon modelinin normallik varsayımı isteğe bağlı varsayımdır,

ancak modelin geçerliliğinin testi için önemlidir.


a) Alternatif modellerin seçiminde 2 ham r ile 2r karşılaştırılamaz.

b) Orijinden geçen regresyon modelinde sabit parametre olmadığı için 2 ham r

hesaplanır.

c) 2 ham r regresyon ile açıklanan değişmeden hesaplanır.

d) 2 ham r -1 ile 1 değerleri arasında yer alır.

e) Orijinden geçen modelinde 2 ham r ’nin hesaplanması isteğe bağlıdır.

206


a) Log-log model ile log-doğrusal model belirginlik katsayısına göre karşılaştırılamaz.

b) Log-log modelde bağımsız değişkenler sıfırdan büyük olmalıdır.

c) Doğrusal- log modelde bağımsız değişken sıfırdan büyük olmalıdır.

d) Log-log model ile Doğrusal- log model belirginlik katsayısına göre karşılaştırılamaz.

e) Log- doğrusal .modelde bağımsız değişken sıfırdan büyük olmalıdır.

Cevaplar

1) c

2) a

3) e

4) b

5) e

6) c

7) d

8) d

9) a

10) a

207

8. ÇOK DEĞİŞKENLİ REGRESYON MODELİ

208


8.1. Çok Değişkenli Regresyon Modeli

8.2. Çok Değişkenli Regresyon Modelinin Varsayımları

8.3. Çoklu Değişkenli Regresyon Modeli Parametrelerinin Tahmini: En Küçük Kareler

Yöntemi

8.4. Açıklayıcı Örnekler : İthalat Modeli

8.5. Hata Terimi Varyansının ( σ2 )Tahmini

8.6. Açıklayıcı Örnek: İthalat Modeli

209


1) Bağımlı değişkeni etkileyen birden fazla bağımsız değişken varsa, ekonometrik

model nasıl tahmin edilir?

2) Bu modelin parametreleri nasıl yorumlanır?

210




Çok Değişkenli Regresyon

Modeli ve Tahmini

Birden fazla bağımsız

değişkeni olan bir modelin

parametreleri nasıl tahmin

edileceği ve yorumlanacağı


tekrar edilerek

Esneklik Çok değişkenli regresyon

modellerinde esneklik

katsayılarının hesaplanması

ve yorumlanması


tekrar edilerek

211

Anahtar Kavramlar

Çok değişkenli regresyon modeli

Esneklik

hata teriminin varyans tahmini

Hata varyans tahmincisi

EKK tahmincisi

EKK tahmini

212

Giriş

Basit regresyon modelinin tahmini kolay olmasına karşın iktisadi ilişkilerin bazılarını

açıklamada yetersiz kalmaktadır. Çoğu iktisadi ilişkide bağımlı değişkeni etkileyen iki veya

daha fazla değişken vardır. Bu değişkenlerden bazıları model dışında bırakılır ve iktisadi

ilişkiler basit regresyon modeli ile tahmin edilirse, önemli değişkenler model dışında kalacak

ve model spesifikasyon hatalarından dışlanmış değişken durumda ortaya çıkan olumsuzluklara

maruz kalacaktır. Ekonometrik model mümkün olduğunca sade olmalıdır ancak modelde

bağımlı değişkeni etkileyen önemli bağımsız değişkenlere mutlaka yer verilmelidir. Bu

dersimizde birden fazla bağımsız değişkeni olan ve çok değişkenli regresyon modeli olarak

bilinen konuya giriş yapacak, çok değişkenli modelin parametrelerinin tahmini, yorumu ve hata

terimi varyansının tahminini ele alacağız. Ayrıca klasik doğrusal regresyon modelinin çok

değişkenli regresyon modeli için varsayımları kısaca ele alınacaktır.

Basit regresyon modelinde bağımlı değişken Y sadece bir bağımsız değişken X ile

ilişkili olduğu için model basit regresyon ile adlandırılır. Bu model pek çok durum için yararlı

olmasına karşın, çoğu iktisadi modelde bağımlı değişken Y’yi etkileyen iki veya daha fazla

bağımsız değişken etkilemektedir. Örneğin talep denkleminde, bir malın talep edilen miktarı,

bu malın fiyatına, ikame ve tamamlayıcı malların fiyatlarına ve gelire bağlıdır. Bir üretim

fonksiyonundaki çıktı, bir girdiden daha fazlasının bir fonksiyonudur. Toplam para talebi,

toplam gelir ve faiz oranın bir fonksiyonudur. Yatırım ise faiz oranı ve gelirdeki değişime

bağlıdır.

Birden fazla açıklayıcı değişkenli bir iktisadi modeli, buna uygun ekonometrik

modeline dönüştürüldüğünde bu model, çok değişkenli regresyon modeli (çoklu regresyon

modeli) olarak adlandırılmaktadır. Önceki bölümlerde basit regresyon modeli için

geliştirdiğimiz sonuçların çoğu, çok değişkenli regresyon modeli için genişletilebilir.

parametresinin yorumunda küçük değişiklikler söz konusudur, t-dağılımı için serbestlik

derecesi değişecektir ve açıklayıcı değişkenlerin ( X ) özellikleri ile ilgili varsayıma ilave

varsayıma ihtiyaç vardır. Çok değişkenli regresyon modelinin anlaşılabilmesi için basit

regresyon modelinin özümsenmiş olması gerekir.

213

8.1. Çok Değişkenli Regresyon Modeli

Daha önceki bölümde basit regresyon modeli ile reklam harcamalarının farklı

düzeylerinin satışlar üzerindeki ortalama etkisini tespit ettik. Firma reklam harcamalarının

farklı düzeylerinin yanı sıra farklı fiyat yapılarının da etkilerini değerlendirmek isteyebilir.

Firma reklam harcamalarının düzeyi değiştikçe, satış rakamlarının nasıl değişecek?

Reklam harcamasındaki bir artış, satışlarda bir artışa yol açar mı? Eğer bu mümkünse,

satışlardaki artış, artan reklam harcamasını savunmak için yeterli midir? Firma ayrıca, fiyatlama

stratejisi ile de ilgilidir. Düşen fiyatlar, satış hasılatında bir artışa mı yoksa bir azalışa mı yol

açmaktadır? Fiyattaki bir azalma, satılan miktarda yalnızca küçük bir artışa yol açıyorsa, satış

hasılatı azalır ( talep, düşük fiyat esnekliğine sahiptir); satılan miktarda büyük bir artışa yol

açan bir fiyat düşüşü, hasılatta bir artışı sağlayacaktır ( talep fiyata göre, esnektir). Bu iktisadi

bilgi, etkili yönetim için temeldir.

İlk adım, satış hasılatının bir veya daha fazla açıklayıcı değişkene bağlı olduğu bir

iktisadi model kurmaktır. Satış hasılatının (Y ) , fiyat ( 1X ) ve reklam harcaması ( 2X ) ile

doğrusal olarak ilişkili olduğunu hipotezi altında iktisadi model aşağıdaki gibidir:

0 1 1 2 2iY X X

Bu denklemde, Y aylık satış hasılatını temsil etmektedir, 1X fiyat ve 2X ise reklam

harcaması temsil etmektedir. Satış hasılatı (Y ) ve reklam harcamaları ( 1X ) bin lira, fiyat (

2X ) ise lira cinsinden ölçülmektedir. 0 1, ve 2 , satışların ( Y ) fiyat ( 1X ) ve reklam

harcamalarına ( 2X ) bağımlılığını gösteren, bilinmeyen parametreler. Matematiksel olarak

kesim (otonom) parametresi 0 , bağımsız değişkenler sıfır değerini aldığında bağımlı

değişkenin değeridir. Ancak basit regresyon bahsinde de belirtildiği gibi çoğu durumda kesim

parametresinin, açık bir iktisadi yorumu yoktur. Örneğin bu örnekte fiyatın ve reklam

harcamalarının sıfır olması ( 1 2 0X X ) durumu iktisadi açıdan gerçekçi değildir. Çok özel

durumlar haricinde, doğrudan bir iktisadi yorumu olmasa bile, her zamanda modele bir sabit

eklenir.

1 ’nin işareti pozitif veya negatif olabilir. Fiyattaki bir artış, satış hasılatında bir artışa

yol açıyorsa 1 0 olup, talebin fiyat esnekliği, esnek değildir. Aksine, fiyattaki bir artış,

satışlarda bir azalışa yol açıyorsa, talebin fiyat esnekliği, esnektir ve bu durumda, 1 0 olur.

Böylece, 1 ’nin işaret bilgisi, talebin fiyat esnekliği hakkında genel bilgi sağlar. 1 ’nin

büyüklüğü, veri bir fiyat değişimi karşısında, satış gelirlerindeki değişim miktarını ölçer. Diğer

taraftan reklam harcamalarının atışlar üzerindeki etkisini gösteren 2 ’in işaretinin pozitif

olmasını bekleriz, reklam çok kötü olmadıkça, reklam harcamasındaki bir artış satış hasılatında

bir artışa yol açacaktır. 2 1 ise reklam harcamasında 1,000 lira’lık bir artış, satış gelirlerinde

214

1,000 lira’ dan daha az bir artış sağlayacaktır. 2 1 ise daha fazla bir artış sağlayacaktır. Bu

sebeple, firmanın reklam politikası açısından, 2 bilgisi çok önemlidir.

0 1, ve 2 ‘den yukarıdaki bilgilere ulaşabilmenin yolu bu iktisadi modeli,

ekonometrik bir modele dönüştürmektir.

Yukarıdaki iktisadi model satışalar için beklenen veya ortalama davranışını

açıklamaktadır. Böylece, bu durumu

0 1 1 2 2i i iE Y X X

olarak yazabiliriz, burada , iE Y satış gelirlerinin “beklenen değeri” dir. Satış hasılatı, fiyat ve

reklam verileri, tam bir doğrusal ilişki izlemeyecektir.

Çok değişkenli bu model bir doğruyu göstermemekte, bir düzlemi göstermektedir.

Gözlemlenebilir satış geliri ile beklenen satış geliri değeri arasındaki fark, rassal hata

terimi ’dir i i iu Y E Y . Rassal hata, satış gelirinin, beklenen değerinden farklı olmasına yol

açan, fiyat ve reklam haricindeki tüm faktörleri temsil eder. Bu faktörler, hava koşullar,

rakiplerin davranışı, tüketici davranışındaki farklar olabilir. Hata terimini eklemek aşağıdaki

modeli sağlar,

0 1 1 2 2i i i iY E Y u X X u

İktisadi model, satış gelirleri ile fiyat ve reklam harcamaları ortalama sistematik ilişkiyi

açıklar. Beklenen değer iE Y rassal olmayan, sistematik bileşendir. Ancak satış gelirlerinin

beklenen değerine rassal hata eklendiği için satışlar da rassal bir değişkendir. Satış gelirinin

değerinin ne olacağı, gözlemleninceye kadar bilinmez.

Hata terimi ve dağılımı ile ilgili varsayımların kullanılmaya başlanması ile iktisadi

model, ekonometrik modele dönüşmektedir. Ekonometrik model, değişkenler arasındaki

ilişkilerin daha gerçekçi bir açıklamasını ve bunun yanısıra bilinmeyen parametrelerin

tahmincilerinin değelerlendirilmesi ve geliştirilmesi için bir çerçeve sağlamaktadır.

Çok değişkenli regresyon modelinde, bağımlı değişken Y, doğrusal denklem boyunca k-

1 sayıda bağımsız değişken (açıklayıcı değişken) 1 2 1, , , kX X X ile ilişkilidir. Çok değişkenli

regresyon modeli aşağıdaki gibi gösterilebilir.

0 1 1 2 2 1 1i i i k ik iY X X X u

215

1 2 1, , , k ; Y ile 1 2 1, , kX X X değişkenleri arasında ilişki kuran modelin

bilinmeyen parametreleridir. Parametrelerin yorumu basit regresyonda olduğundan küçük bir

farklılık göstermektedir. Örneğin 2 parametresi diğer değişkenler sabit tutulduğunda 2X

değişkenindeki bir birim değişimin, Y’nin beklenen değeri üzerindeki etkisini ölçer. 2 , kısmi

türev ile aşağıdaki gibi gösterilebilir.

2

2 2

( ) ( )E Y E Y

X X

1 3 1, , sabit tutulursakX X X

0 parametresi, kesim terimi (otonom parametre)’dir. Çok değişkenli regresyon

modelinin tahmini, çok değişkenli regresyon modellerinin en basiti olan iki bağımsız değişkenli

model çerçevesinde incelenecektir. İkiden fazla bağımsız değişkenli modellerin tahmini daha

fazla matematiksel işlemler gerektirdiği için Ekonometri Paket Programları ile yapılmaktadır.

İki bağımsız değişkenli çok değişkenli regresyon modeli aşağıdaki gibi gösterilebilir.

0 1 1 2 2i i i iY X X u

Yukarıda verilen modelde parametre sayısı (k) 3’ e eşittir. Bu parametreler için

uygulanacak nokta ve aralık tahminleri, daha fazla bağımsız değişkenli modeller (𝑘 > 3) için

de geçerlidir.

8.2. Çok Değişkenli Regresyon Modelinin Varsayımları

Çok değişkenli ekonometrik model için rassal hataların ui olasılık dağılımı ile ilgili

varsayımlar, basit regresyon modelindeki varsayımlara benzerdir. Bunlar,

1. ( ) 0iE u

Her alt ana kütle için rassal hata, sıfır ortalamalı bir olasılık dağılımına sahiptir.

Hataların bazıları pozitif, bazıları negatif olacaktır. Çok büyük gözlemler için, bunların

ortalamada sıfır olacağı beklenmektedir.

2. 2 2( )i iE u Var u

Her alt ana kütle için rassal hata, 2 varyanslı bir olasılık dağılımına sahiptir. Basit

regresyondan bilindiği üzere, varyans bilinmeyen bir parametredir ve modeldeki

belirsizliği ölçer. Rassal hatanın varyansı her bir gözlem için aynıdır. Böylece

herhangi bir gözlem için model belirsizliği daha fazla veya az değildir ve hata terimi

iktisadi değişkenle doğrudan ilişkili değildir. Bu özelliğe sahip hatalar, sabit

varyanslı (homoskedastik; eşit varyanslı) olarak isimlendirilir.

3. ( , ) 0i jCov u u İki farklı rassal hata arasındaki kovaryans sıfırdır. Bir gözlemin

hatasının büyüklüğü, diğer bir gözlemin hatasının olası büyüklüğünü etkilemez. Bu

sebeple, herhangi bir hata çifti korelasyonlu değildir. Bu varsayım sağlanmazsa

216

otokorelasyon olarak adlandırılan ve modelin aleyhine sonuçlar doğuran

ekonometrik bir problem söz konusu olur.

4. Rassal hataların iu , normal olasılık dağılımına sahiptir, 20,iu N .

Yine basit regresyondan bilindiği üzere bağımlı değişken Y’deki her bir gözlem, rassal

hata terimi iu ’ya bağlı olduğu için, Y’de rassal bir değişkendir. Y’nin istatistiksel özellikleri,

u’nun özelliklerinden elde edilir. Bu özellikler aşağıdaki gibidir:

5. Y’nin beklenen (koşullu ortalama) değeri 1 2 0 1 1 2 2,E Y X X X X , bağımsız

değişkenlerin ve bilinmeyen parametrelerin değerlerine bağlıdır. ( ) 0iE u olduğu

varsayımı, Y′ nin ortalama değerinin her bir gözlem için değişeceğini ve

0 1 1 2 2E Y X X regresyon fonksiyonu ile belirleneceği anlamına

gelmektedir.

6. 2( ) ( )i iVar Y Var u . Y’nin olasılık dağılımının varyansı her bir gözlem için

sabittir. Y’nin bazı gözlemleri, diğerlerine göre, regresyon fonksiyonundan daha

uzakta değildir. Y‘nin varyansı ile u’nun varyansı eşittir, ancak beklenen değerleri

farklıdır.

7. ( , ) ( , ) 0i j i jCov y y Cov u u .

Bağımlı değişkenin herhangi iki gözlemi korelasyonlu değildir. Örneğin, bir gözlem

E Y ’nin üzerindeyse ( pozitif ise), sonraki gözlem muhtemelen E Y ’nin altında

(negatif)’ dır.

8. Y ‘nin değerleri, ortalamaları etrafında normal dağılır 2

0 1 1 2 2 ,Y N X X .

Bu varsayım, 20,iu N varsayımına eşittir.

Çok değişkenli regresyon modeli için yukardaki hata terimi ( ve dolayısıyla bağımlı

değişken ) ile ilgili varsayımlara ek olarak, açıklayıcı değişken ile ilgili iki varsayım vardır.

Bunlardan ilki basit regresyondan bilinmekte, ancak ikincisi çok değişkenli regresyon modeline

özgü bir varsayımdır.

9. Bağımsız değişkenler rassal değildir. Bu varsayım göre bağımlı değişkenin değerleri

gözlemlenmeden önce, bağımsız değişkenin değerleri bilinmektedir.

10. Bağımsız değişkenlerden herhangi biri, diğerlerinin tam doğrusal bir fonksiyonu

değildir. Bu varsayım, hiçbir değişkenin gereksiz olmadığı varsayımına eşdeğerdir.

Göreceğimiz gibi, bu varsayım sağlanamazsa, -tam doğrusal bağlantı olarak

isimlendirilen bir durum- en küçük kareler yöntemi başarısız olur.

217

8.3. Çoklu Değişkenli Regresyon Modeli Parametrelerinin Tahmini:

En Küçük Kareler Yöntemi

Bu bölümde, çok değişkenli regresyon modelinin bilinmeyen parametrelerinin tahmini

için en küçük kareler ilkesinin kullanımı ele alınacaktır. Çok değişkenli regresyon modelinin

en basiti aşağıda verilen iki bağımsız değişkene sahip modeldir.

0 1 1 2 2i i i iY X X u

Ekonometrik modelin bilinmeyen parametrelerinin tahmini için, bir tahminci olarak en

küçük kareler yöntemini kullanılacaktır. Basit regresyondan bilindiği üzere EKK ilkesi ile iY

’nin gözlemlenen değerleri ( iY ) ile beklenen değerleri 0 1 1 2 2i i iE Y X X arasındaki

farkların kareli toplamını minimize eden 0 1, ve 2 değerlerinin bulunmasına

dayanmaktadır. Bu amaçla örnek verilerinden hareket edilir ve örnek regresyon modeli

aşağıdaki gibi yazılır.

0 1 1 2 2ˆ ˆ ˆˆ ˆ ˆ

i i i i i iY Y u X X u

i. gözlem için iY ’nin değeri îY ve îu

’ye bağlıdır. EKK yöntemi ile bilinmeyen

parametrelerin tahmini için yine bilinmeyen paremetrelerin bir fonksiyonu olan kalıntı kareler

toplamı fonksiyonunun minimize edilmesi gerekir. Kalıntı kareler toplamı fonksiyonunun(2îu

) minimizasyonu için, fonksiyonda 0 1ˆ ˆ, ve 2 ’ye göre kısmi türev alınarak sıfıra eşitlenir.

2

0

ˆ0

îu

, 2

1

ˆ0

îu

, 2

2

ˆ0

îu

Gerekli matematiksel işlemler ve sadeleştirmeler yapılırsa, aşağıdaki denklem sistemi elde

edilir.

0 1 1 2 2ˆ ˆ ˆ

i i iY n X X

2

1 0 1 1 1 2 1 2ˆ ˆ ˆ

i i i i i iY X X X X X Normal Denklemler

2

2 0 2 1 1 2 2 2ˆ ˆ ˆ

i i i i i iY X X X X X

Yukarıdaki denklem sistemi, üç bilinmeyenli üç denklemden oluşmakta ve EKK’in

normal denklemleri adını almaktadır. Denklemler eş anlı çözümlendiğinde modelin

bilinmeyenleri 0 1ˆ ˆ, ve 2 hesaplanır. Normal denklemlerde yer alan unsurlar değişkenlerin

gözlemlenen değerleridir. Orijin 0 noktası olup değişkenlerin 0’a uzaklığı hesaplamalara

katılmıştır.

218

Ancak bu normal denklemlerin çözümü oldukça fazla zaman alır. Bundan dolayı üç

değişkenli regresyon modelinin EKK tahmini için değişkenlerin ortalamadan farkları (

1 1 1 2 2 2, ,i i i i i iY Y y X X x X X x ) kullanılacaktır.

Öncelikle normal denklemlerden birincisinin

0 1 1 2 2ˆ ˆ ˆ

i i iY n X X

her iki yanı n gözlem sayısına bölünür ve

0 1 1 2 2ˆ ˆ ˆY X X

sonucuna ulaşılır. Daha sonraki aşamada i.gözlem için îY ile Y arasındaki fark alınır. EKK

yönteminin özelliklerinden Y Y , çok değişkenli regresyon içinde geçerlidir.

0 1 1 2 2 0 1 1 2 2ˆ ˆ ˆ ˆ ˆ ˆˆ ˆ ˆ

i i i iY Y Y Y X X X X

Yukarıda 0 sadeleşir ve gerekli kısaltma yapılırsa

1 1 1 2 2 2ˆ ˆˆ

i i iY Y X X X X ’dan

1 1 2 2ˆ ˆˆ

i i iy x x

sonucuna ulaşılır ki; bu gösterim ortalamadan farklara göre örnek regresyon fonksiyonudur.

Daha önce ˆ î i iY Y u eşitliğinin, değişkenlerin ortalamalarında farklarıyla ˆ ˆ

i i iy y u ile

gösterilebileceği bilinmektedir. Buna göre;

i. gözlem için

ˆ î i iy y u ’den

1 1 2 2ˆ ˆˆ ˆ

i i i i i iu y y y x x

olarak yeniden yazılabilir. i=1…..n’e kadar her iki tarafın kareler toplamı alınır ve hata terimi

kalıntı kareler toplamı fonksiyonunda 1 ve 2 ’e göre kısmi türev alınarak sıfıra eşitlenir.

2

2

1 1 2 2ˆ ˆˆ

i i i iu y x x

2

1

ˆ0

îu

, 2

2

ˆ0

îu

219

Kısmi türevlerin sıfıra eşitlenip çözümlenmesinden aşağıdaki denklem sistemi elde edilir.

2

1 1 1 2 1 2ˆ ˆ

i i i i ix y x x x

2

2 1 1 2 2 2ˆ ˆ

i i i i ix y x x x

Yukarıdaki denklem sistemine Cramer kuralı uygulanarak 1 ve 2 hesaplanır.

2

1 2 2 1 2

1 22 2

1 2 1 2

ˆ i i i i i i i

i i i i

x y x x y x x

x x x x

2

1 1 2 2 1

2 22 2

1 2 1 2

ˆ i i i i i i i

i i i i

x y x x x y x

x x x x

0 ise, 0 1 1 2 2ˆ ˆ ˆY X X eşitliğinden hesaplanır.

Basit doğrusal regresyon modeli uzayda bir doğru belirlerken, çok değişkenli regresyon

modelleri bir düzlem belirlediğini bir kez daha hatırlatalım.

En küçük kareler ilkesini, en küçük kareler tahmincileri ve en küçük kareler tahminleri

arasındaki farkı anlamak önemlidir. Örnek verileri kullanılarak kalıntıların karelerinin toplamı

fonksiyonu minimize edilerek elde edilen 0 1ˆ ˆ, ve 2 için formüller, bilinmeyen

parametrelerin en küçük kareler tahmincileri olarak isimlendirilen tahmin yöntemleridir.

Genelde, bunların değerleri, veriler gözlemlenene kadar ve tahminler hesaplanana kadar

bilinmediği için, en küçük kareler tahmincileri de rassal değişkenlerdir. En küçük kareler

tahminleri ise sayısal değerlerdir.

8.4. Açıklayıcı Örnekler : İthalat Modeli

Aşağıdaki tabloda ithalat, GSMH ve ithal malları fiyat endeksi verileri yer almaktadır.

1986-1989 dönemi için ithalat denklemi EKK yöntemi ile tahmin edilecektir. Not: Bu

uygulamada 3 parametre tahmin edilmekte, ancak 4 gözlem kullanılmaktadır. Bu durum

ekonometrik uygulama için uygun değildir, daha fazla sayıda gözlemin olması gereklidir.

Ancak buradaki amaç EKK tahminlerinin nasıl elde edildiğini göstermek olduğu için,

matematiksel işlemlerde basitlik olması açısından gözlem sayısı sınırlı tutulmuştur.

Yıllar İthalat (Milyar Lira)

Y

GSMH (Milyar Lira)

X1

İthal Malları Fiyat

Endeksi X2

1986 1 10 2

1987 3 12 1

1988 5 16 2

220

1989 7 22 3

İthalat denklemi 0 1 1 2 2ˆ ˆ ˆˆ

i i iY X X ’de yer alan 0 1ˆ ˆ, ve 2 için EKK

tahmincileri aşağıdaki gibidir.

2

1 2 2 1 2

1 22 2

1 2 1 2

ˆ i i i i i i i

i i i i

x y x x y x x

x x x x

2

1 1 2 2 1

2 22 2

1 2 1 2

ˆ i i i i i i i

i i i i

x y x x x y x

x x x x

0 1 1 2 2ˆ ˆ ˆY X X

Burada 1 1 1 2 2 2, ,i i i i i iY Y y X X x X X x ’dir . Öncelikle EKK

tahmincilerinde yer alan aşağıdaki unsurların hesaplanması gerekir.

1 1 1i i i iy x Y X nX Y 2 2

iiy Y nY

2 2 2i i i iy x Y X nX Y 2 2 2

1 1 1i ix X nX

1 2 1 2 1 2i i i ix x X X nX X 2 2 2

2 2 2i ix X nX

Yıllar Y X1 X2 Y2 2

1X 2

2X 1YX

2YX 1 2X X

1986 1 10 2 1 100 4 10 2 20

1987 3 12 1 9 144 1 36 3 12

1988 5 16 2 25 256 4 80 10 32

1989 7 22 3 49 484 9 154 21 66

16iY

4Y

1 60iX

1 15X

2 8iX

2 2X

2

iY

84

2

1X

984

2

2X

18

1iY X

280

2YX

36

1 2X X

130

221

1 1 1

2 2 2

2 22

22 2 2

1 1 1

22 2 2

2 2 2

1 2 1 2 1 2

280 4 15 4 40

36 4 2 4 20

84 4 4 20

984 4 15 84

18 4 2 2

130 4 15 2 10

i i i i

i i i i

ii

i i

i i

i i i i

y x Y X nX Y

y x Y X nX Y

y Y nY

x X nX

x X nX

x x X X nX X

1 2

40 2 4 10ˆ 0.5884 2 10

2 2

40 10 4 84ˆ 0.9484 2 10

0ˆ 4 0.58 15 0.94 2 2.9412

1 2ˆ 2.94 0.58 0.94iY X X

İthalat malları fiyat indeksi sabit iken, GSMH’daki 1 milyar liralık artış, ithalatı

ortalama olarak 0.58 milyar lira arttıracaktır. GSMH sabit iken, ithal malları fiyat indeksindeki

1 br’lik artış ithalatı 0.94 milyar lira azaltır. GSMH ve ithalat fiyat indeksi dışındaki

değişkenlerin ithalat üzerindeki ortalama etkisi -2.94 milyar liradır.

İthalatın gelir ve fiyata göre ortalama esnekliği aşağıdaki gibi hesaplanır.

1

1 11

1

15ˆ (0.58) 2.1754

YX

Y X X

X Y Y

2

2 22

2

2ˆ ( 0.94) 0.474

YX

Y X X

X Y Y

GSMH’daki %1’lik artış, ithalatı ortalama olarak % 2.2 arttırmaktadır. Fiyatlardaki %1’lik

artış, ithalatı ortalama olarak % .47 azaltmaktadır.

Bu aşamada X1=16 ve X2=2 olduğu noktada ithalatın gelir ve fiyata için elastikiyetini

hesaplayarak yorumlayalım.

Öncelikle X1=16 ve X2=2 olduğu noktada ithalatın tahmini değerini bulmamız gerekir.

1 2ˆ 2.94 0.58 0.94 2.94 0.58 16 0.94 2 4.46iY X X

X1=16 olduğu noktada ithalatın gelir esnekliği

222

1

1 11

1

14 14ˆ (0.58) 1.82ˆ ˆ 4.46

iYX

Y X X

X Y Y

X2=2 olduğu noktada ithalatın fiyat esnekliği

2

2 22

2

2 2ˆ ( 0.94)ˆ ˆ 4

..

26

44

0iYX

Y X X

X Y Y

Bu sonuca göre X1=16 ve X2=2 olduğu noktada ithalat gelire göre esnek değil, fiyata

göre esnektir.

8.5. Hata Terimi Varyansının ( 𝛔𝟐 )Tahmini

Çok değişkenli regresyon modelinde, modelin parametreleri 0 1 2 1, , , , k ’nın

tahminlerinden sonra tahmin edilmesi gereken bir diğer parametre de hata terimi varyansıdır.

2 2( ) ( )i iVar u E u

Hata terimi varyansını ( 2 ), kareli hataların (2

iu ) beklenen değeri veya anakütle

ortalaması olarak düşünebiliriz. Ancak kareli hatalar (2

iu ) gözlemlenemez. Bu nedenle 2 için

EKK kalıntılarının karelerine dayanan bir tahminci geliştirilir. 0 1 1 2 2ˆ ˆ ˆˆ

i i iY X X için, bu

kalıntılar aşağıdaki gibidir:

0 1 1 2 2ˆ ˆ ˆˆˆ

i i i i i iu Y Y Y X X

2 ’nin iu ’deki değişkenliği veya eşdeğer olarak, Yi’nin ortalama fonksiyon

0 1 1 2 2i iX X etrafında değişkenliği ölçmesi nedeniyle îu de 2 ile ilgili bilgi

sağlayacaktır.2îu ’den elde edilen bu bilgiyi kullanan ve istatistiksel açıdan iyi özellikleri sahip

olan 2 için bir tahminci aşağıdaki gibidir:

2

2 1

ˆ

ˆ

n

i

i

u

n k

Burada k, çok değişkenli regresyon modelinde tahmin edilen parametre sayısıdır. 2 ,

ortalama işlemindeki n yerine n-k olan payda ile 2îu ‘nın bir ortalaması olarak düşünülebilir.

2 sapmasız olması için, 2

iu ’yi, 2îu ile yer değiştirmek, n yerine n-k ’nin kullanılmasını

gerektirir.

îu , iu ’in tahminleri olduğu için, îu ’nın büyük değerleri,’ 2 nin büyük olduğu

anlamına gelmektedir. Diğer yandan îu ’nın küçük değerleri, 2 ’nin küçük olduğunu ifade

etmektedir. îu ’nın “büyük” değerleri, büyük pozitif ve büyük negatif değerler anlamındadır.

223

Kalıntı karelerini2îu ’yi kullanmanın amacı pozitif değerlerin

2îu negatif değerleri yok etmesini

önlemektir, böylece, kalıntı kareler toplamı (2îu ) , 2 ile ilgili bilgi sağlamaktadır.


Yukarıda verilen ithalat örneğimiz için ana kütle hata teriminin varyansını tahmin

edelim.

1 2ˆ 2.82 0.58 0.94iY X X

Hata teriminin veryansının tahmincisi aşağıdaki gibidir.

2

2 1

ˆ

ˆ

n

i

i

u

n k

n=gözlem sayısı, k=parametre saıyısı

Burada n=4 k=3 olduğu bilinmekte, ancak 2

1

ˆn

i

i

u

bilinmemektedir. ˆî iu Y Y

eşitliğinden kalıntılar karelerinin toplamı aşağıdaki gibi hesaplanır.

iY îY

î i iu Y Y

2îu

1 1.1 -0.1 0.01

3 3.2 -0.2 0.04

5 4.58 0.42 0.1764

7 7.12 -0.12 0.0144

2ˆ 0.2408iu

42

2 1

ˆ0.2408

ˆ 0.24084 3

i

i

u

n k

İthalat modeli için rassal hatanın varyansı 0.2408 tahmin edilmiştir. Buradan tahminin

standart hatası: 2ˆ ˆ 0.2408 0.4907 ’dir

224

Uygulamalar

Gözlem Üretim

(bin adet)

Çalışma saati

(100 saat)

Sermaye

(milyon lira)

1 11 10 25

2 10 7 22

3 12 10 30

4 6 5 18

5 10 8 21

6 7 8 15

7 9 6 17

8 10 7 12

9 11 9 14

10 10 10 24

Yukarıdaki verileri kullanarak 1-4 arası soruları cevaplandırınız.

1) Regresyon denklemini tahmin ediniz.

Yukarıdaki veriler üretim modeline aittir. Üretim(Q) emek (L) ve sermayenin (S)

fonksiyonu olduğuna göre üretim modeli için aşağıdaki regresyon denklemini tahmin edeceğiz.

0 1 2ˆ ˆ ˆQ L K

Q ; Y, L; X1 ve K ; X2 ile gösterilirse öncelikle aşağıdaki denklem sisteminin çözümü ile 1

ve 2 ’nin tahmin edilmesi gerekir.

2

1 1 1 2 1 2ˆ ˆ

i i i i ix y x x x

2

2 1 1 2 2 2ˆ ˆ

i i i i ix y x x x

Dikkat edilirse denklemlerdeki değişkenler ortalamalarından farkları ile gösterilmiştir.

Dolayısıyla ara sonuçların aşağıdaki gibi hesaplanması gerekir.

1 1 1

2 2 2

2 22

22 2 2

1 1 1

22 2 2

2 2 2

1 2 1 2 1 2

789 10 8 9.6 21

1945 10 19.8 9.6 44.2

952 10 9.6 30.4

668 10 8 28

4204 10 19.8 283.6

1634 10 8

i i i i

i i i i

ii

i i

i i

i i i i

y x Y X nX Y

y x Y X nX Y

y Y nY

x X nX

x X nX

x x X X nX X

19.8 50

225

Y

X1 X2 YX1 YX2 X1X2 Y2

X12 X1

2 X1 X22

11 10 25 110 275 250 121 100 625

10 7 22 70 220 154 100 49 484

12 10 30 120 360 300 144 100 900

6 5 18 30 108 90 36 25 324

10 8 21 80 210 168 100 64 441

7 8 15 56 105 120 49 64 225

9 6 17 54 153 102 81 36 289

10 7 12 70 120 84 100 49 144

11 9 14 99 154 126 121 81 196

10 10 24 100 240 240 100 100 576

96 80 198 789 1945 1634 952 668 4204

9.6 8 19.8

2

1 2 2 1 2

1 22 2

1 2 1 2

20.688

ˆ

21 283.6 44.2 50

28 283.6 50428

i i i i i i i

i i i i

x y x x y x x

x x x x

2

1 1 2 2 1

2 22 2

1 2 1 2

20.03

ˆ

(21 50) (44.2 28)

28 283.4

6 54 8

0

i i i i i i i

i i i i

x y x x x y x

x x x x

0 1 1 2 2

0.68842

ˆ ˆ ˆ

9.6 8 19.88 0.03448 4.775283

Y X X

Böylece doğrusal üretim fonksiyonunun tahmini aşağıdaki gibidir.

ˆ 4.775283 0.688428 0.03448Q L K

2) Tahmin ettiğiniz regresyon modelini yorumlayınız.

Sermaye sabitken çalışma saati 100 saat artarsa üretim 688.428 adet artacaktır. Çalışma

saati sabitken sermaye 1 milyon lira artarsa üretim 34.48 adet azalacaktır. Emek ve sermaye

sıfır iken üretim 4775.283 adettir (Not: emek ve sermaye olmaksızın üretimin gerçekleşmesi

olası değildir, aslında kesim parametresinin yorumlanmaması gerekir.)

226

3) Hata teriminin varyansını tahmin ediniz.

Hata terimi varyansının tahmin edicisi

2

2ˆ

îu

n k

’dır.

Hata teriminin varyansının tahmin edilebilmesi için kalıntı kareler toplamının hesaplanması

gerekir. Daha önceki derslerimizden hatırlanacağı üzere kalıntı kareler toplamını hesaplamak

için;

- Tahmin edilen regresyon modelinde sırasıyla her gözlem için (i =1,2,…,10) emek ve

sermayenin değerleri yazılarak üretimin tahmini değeri hesaplanır ( îQ ) .

- Bağımlı değişken üretimin gözlemlenen değerlerinden ( iQ ) tahmini değerleri( îQ )

çıkarılarak kalıntılar ( îu ) hesaplanır ( ˆ î ii Q Qu ).

- i =1,2,…,10 ‘a kadar hesaplanan kalıntıların kareleri (2îu ) hesaplanır.

- i =1,2,…,10 ‘a kadar hesaplanan kalıntıların karelerinin toplamı alınır.

Bu uygulama için kalıntıların karelerinin toplamı 2ˆ 14.41898iu hesaplanmıştır. Gözlem

sayısı 10, tahmin edilen parametre sayısı 3’ eşit olduğuna göre, hata teriminin varyansı


2

2ˆ 14.41898

ˆ10

2.053

9854iu

n k

4) Emeğin ve kapitalin ortalamaya esnekliğini hesaplayarak yorumlayınız.

1 0.68ˆ ( 88428 0)

9.6.57369QL

Q L L

L Q Q

2 0.03419.8ˆ ( )9.6

48 0.07112QK

Q K K

K Q Q

Bu sonuçlara göre emek %1 artarsa üretim yaklaşık olarak ortalama % 0.57 artar. 0.57

aynı zamanda emeğin marjinal verimliliğidir. Sermaye %1 aratarsa üretim yaklaşık ortalama %

0.07 azalır. -0.07 sermayenin marjinal verimliliğidir.

227

5) Emeğin 8 birim sermayenin 15 birim olduğu noktada emek ve sermayenin

esnekliği hesaplayarak yorumlayınız.

Öncelikle emeğin 8 birim sermayenin 15 birim olduğu noktada üretimin tahmini değeri

hesaplanır.

ˆ 4.775283 0.688428 8 0.03448 15 9.765505Q

1 0.688428 0.5639679.76550ˆ 5

8ˆ ( )ˆ

i iQL

L LQ

L Q Q

2 0.0315ˆ ( )

ˆ ˆ448 0.05296

9.765505

i iQK

K KQ

K Q Q

Emeğin 8 birim sermayenin 15 birim olduğu noktada, emekteki %1 lik artış üretim

miktarını yaklaşık % 0.56 arttırırken sermayedeki %1’lik artış üretim miktarını yaklaşık %

0.05 düşürür.

6) Yukarıdaki doğrusal üretim modelin dezavantajları nelerdir? Nasıl bir çözüm

önerirsiniz?

Yukarıda tahmin edilen fonksiyon doğrusal olduğu için sadece tek bir üretim faktörü ile

üretim geçekleşebilir. Çünkü üretim faktörleri birbirleri ile toplanır durumdadır. Ancak iktisadi

açıdan değerlendirildiğinde her iki üretim faktörünün de belli bir oranda kullanılması gerekir.

Ayrıca bu modelde üretim faktörler emek ve sermayenin üretim üzerindeki etkileri sabittir.

Hâlbuki iktisat teorisine göre üretim faktörlerinin artışı bir noktaya kadar üretimi arttırır, ancak

daha sonra bu artış azalarak devam eder. Modelin fonksiyonel biçiminin değiştirilmesi gerekir.

Uygun model 1 2

0

uQ L K e ’nın dönüştürülmüş biçimi log-log modeldir.

7) Modeli yeniden alternatif bir fonksiyonel biçim log-log model ile tahmin

edelim. Log-log model yukarıda verilen üretim fonksiyonundaki değişkenlerin doğal

logaritmalarının yer aldığı model olup, aşağıda verilmiştir.

0 1 2ln lnlnQ Ln L K u

Modelin tahmini için öncelikle değişkenlerin doğal logaritması alınmak suretiyle

dönüştürülmesi gerekir. Veri tablosu aşağıdaki gibi yeniden düzenlenir.

228

Q L K lnQ lnL lnK

11 10 25 2.3978 2.3025 3.2188

10 7 22 2.3025 1.9459 3.0910

12 10 30 2.4849 2.3025 3.4011

6 5 18 1.7917 1.6094 2.8903

10 8 21 2.3025 2.0794 3.0445

7 8 15 1.9459 2.0794 2.7080

9 6 17 2.1972 1.7917 2.8332

10 7 12 2.3025 1.9459 2.4849

11 9 14 2.3978 2.1972 2.6390

10 10 24 2.3025 2.3025 3.1780

Kısaca lnQ , *Y ile; ln L , *

1X ile; ln K , *

2X ile ve 0ln , *

0 ile gösterilirse aşağıdaki

modeli yazar ve EKK ile tahmin ederiz

* * * *

0 1 1 2 2ˆ ˆ ˆˆ

i i iY X X

Yukarıda verilen regresyon denklemi aynen 1. sorudaki gibi tahmin edilir. Tek fark

kullanılan verilerdir. EKK tahmincilerinde logaritması alınarak dönüştürülmüş veriler yer alır.

Burada aynı işlemleri tekrarlamak için sadece sonuç verilecektir. (Not: Okuyucunun modeli

çözmesi tavsiye edilir)

* * *

1 2ˆ 0.815073 0.642258 0.036365i i iY X X

Veya

0.815073 0.642258ln 0.036365lnlnQ L K

8) Tahmin edilen modelin parametrelerini yorumlayınız.

Yukarıdaki model log-log model olduğuna göre doğrusal modelden farklı olarak tahmin

edilen parametreler direkt esnekliği verecektir. Parametrelerin yorumu sırasıyla sermaye sabit

iken emekteki %1 lik değişim üretimi yaklaşık % 0.64, emek sabit iken sermayedeki %1’lik

değişme ise üretimi yaklaşık % 0.04 arttıracaktır.

9) Hata terimi varyansını tahmin ediniz.

10) Yeni modelin kalıntı kareler toplamı 0.195651 ‘e eşit hesaplanmıştır. Böylece hata

terimi varyansının tahmini

2

2ˆ 0.195651

ˆ10

0.027953

iu

n k

olarak hesaplanır.

229

11) İki model arasında tercih yapmak isteseniz hangisini tercih ederdiniz?

Ekonometrik açıdan hangi modelin tercih edilemesi gerektiği hususunda henüz

yeterince veri yok, testlerimizi henüz yapmadık, ancak iktisadi açıdan değerlendirildiğinde log-

log modelin tercih edilmesi daha uygundur.

230

Uygulama Soruları

231


Çok değişkenli regresyon modelinin temel varsayımlarını kısaca ele aldık. Çok

değişkenli regresyon modelinin EKK ile tahminini, tahmin edilen parametrelerin yorumunu ve

hata terimi varyansının tahmini gördük. Konuya mümkün olduğunca çok örnek vererek ve

bunları tahmin ederek, konu pekiştirilmeye çalışılmıştır. Okuyucuya çok değişkenli regresyon

başlığı altında ele alınan konular iyice kavranmadan bir sonraki alt başlığa geçilmemesi tavsiye

edilir

232

Bölüm Soruları

Y X1 X2

1 0 1

2 1 -2

3 2 1

-1 -2 0

0 1 -1

-1 -2 -1

2 0 1

1 -1 1

2 1 0

1-5 arası sorular için yukarıdaki verileri kullanılacaktır.

1) Regresyon denklemini tahmini aşağıdakilerden hangisidir.

a) 1 2ˆ 1.2 0.4 0.2iY X X

b) 1 2ˆ 0.7 0.25 1.6iY X X

c) 1 2ˆ 1 0.8125 0.4iY X X

d) 1 2ˆ 2.2 0.5719 1.062iY X X

e) 1 2ˆ 0.1 0.925 0.24iY X X

2) Tahmin ettiğiniz modelin parametrelerini yorumu aşağıdakilerden hangisidir.

a) 2X sabit iken 1X 1 birim değişirse, Y 0.4 birim artar. 1X sabit iken 2X 1 birim

değişirse, Y 0.2 birim azalır. 1 2 0X X iken, Y 1.2 birimdir.

b) 2X sabit iken 1X 1 birim değişirse, Y 0.25 birim artar. 1X sabit iken 2X 1 birim

değişirse, Y 1.6 birim artar. 1 2 0X X iken, Y 0.7 birimdir.

c) 2X sabit iken 1X 1 birim değişirse, Y 0.8125birim artar. 1X sabit iken 2X 1 birim

değişirse, Y 0.4 birim artar. 1 2 0X X iken, Y 1 birimdir.

d) 2X sabit iken 1X , 1 birim değişirse, Y 0.5719 birim artar. 1X sabit iken 2X 1 birim


e) 2X sabit iken 1X , 1 birim değişirse, Y 0.925 birim artar. 1X sabit iken 2X 1 birim


233

3) Kalıntı kareler toplamını hesaplayınız.

a) 3.8375

b) 0.2971

c) 2.0671

d) 1.8410

e) 0.9163

4) Hata terimi varyansını tahmin ediniz.

a) 1.73021

b) 0.93659

c) 3.81036

d) 0.13329

e) 2.04580

5) Yukarıdaki veriler kullanılarak tahmin edilen log-log modelin aşağıdakilerden

hangisidir?

a) 1 2ˆln 0.2 1.4ln 2.2lniY X X

b) 1 2ˆln 0.8 0.4ln 0.6lniY X X

c) log- log modelin tahmin edilebilmesi için 1 0X ve 2 0X olmalıdır. Bu uygulamada

1X ve 2X değişkenlerin sıfır değerini aldığı gözlemler vardır, dolayısıyla logaritması

alınamadığı için log-log model tahmin edilemez.

d) 1 2ˆln 3.2 0.9ln 1.5lniY X X

e) 1 2ˆln 2.65 1.062ln 2.945lniY X X

6-10 arası sorular için aşağıda verilen tabloda yer alan veriler kullanılacaktır.

Gözlem Talep Fiyat Gelir

1 14 2 200

2 11 3 200

3 15 1.5 180

4 20 0.5 350

5 22 0.4 360

6 18 2.8 250

7 16 1.3 160

8 10 3.5 220

9 9 5 180

10 14 2.2 220

6) Regresyon modelinin tahmini aşağıdakilerden hangisidir?

a) 1 2ˆ 13.495 1.908 0.024iY X X

b) 1 2ˆ 0.405 2.181 1.23iY X X

234

c) 1 2ˆ 0.527 0.603 1.521iY X X

d) 1 2ˆ 2.09 1.896 2.702iY X X

e) 1 2ˆ 0.256 1.335 0.724iY X X

7) Kalıntı kareler toplamı kaçtır?

a) 25.293

b) 18.74

c) 0.961

d) 1.862

e) 5.903

8) Hata tarimi varyansının tahmini aşağıdakilerden hangisidir?

a) 6.028

b) 4.022

c) 5.625

d) 8.145

e) 3.613


a) Çok değişkenli regresyon modeli uzayda bir düzlem belirler.

b) Çok değişkenli regresyon modelinde yer alan bağımsız değişkenler arasında doğrusal

bağlantı olmamalıdır.

c) Kalıntıların toplamı sıfırdan farklı çıkabilir.

d) Çok değişkenli regresyon modelinde serbestlik derecesi n-k’dır. n=gözlem sayısı , k=

parametre sayısı.

e) Çok değişkenli regresyon modellerinde hata terimin koşullu varyansı ile bağımlı

değişkenin koşullu varyansı eşittir.

10) Aşağıdakilerden hangisi çok değişkenli regresyon modelinin temel

varsayımlarından biri değildir?

a) Hata teriminin varyansı sabittir.

b) Bağımsız değişkenler arasında doğrusal bir ilişki yoktur.

c) Hata terimleri gözlemler itibariyle birbirleriyle ilişkisizdir.

d) Bağımsız değişkenlerin varyansları sıfırdan büyüktür.

e) EKK yöntemi ile tahmin edilmelidir.

Cevaplar

1) c

2) c

3)a

235

4)d

5)c

6)a

7)a

8)e

9)c

10)e

236

9. ÇOK DEĞİŞKENLİ REGRESYON MODELİNDE ARALIK TAHMİNİ

VE HİPOTEZ TESTİ

237


9.1. En Küçük Kareler Tahmincilerinin Örnekleme Özellikleri



9.4. En Küçük Kareler Tahmincilerinin Dağılımı

9.4.1. Aralık Tahmini

9.4.2. Hipotez Testi

9.5. Uyumun İyiliğinin Ölçülmesi: Belirginlik Katsayısı

238


1) Çok değişkenli regresyon modeli tahmincilerinin varyans ve kovaryansları nasıl

hesaplanır?

2) Çok değişkenli regresyon modeliden tahmin edilen parametrelerin güven aralıkları

ve hipotez testlari uygulaması nasıl olur?

3) Çok değişkenli regesyon modelinde uyumun iyiliğinin ölçüsü belirginlik katsayısı

nasıl hesaplanır?

239




Aralık Tahmini ve

Hipotez Testi

Çok değişkenli regresyon

modelinde parametreler için

aralık tahminleri

oluşturulabilmek ve çift

taraflı hipotez kurabilmek ve

uygulanabilmek

Ders notları,

İstatistik kitapları

Ekonometri kitapları

Uygulamaların tekrar edilmesi

Belirginlik Katsayısı Çok değişkenli regresyon

modelinin verilere uyumu

hakkında bilgi edinmek

Ders notları

Uygulamalar tekrar edilmeli

Düzeltilmiş Belirginlik

Katsayısı

Çok değişkenli regresyon

modellerinde belirginlik

katsayısının niçin yetersiz

kaldığı ve belirginlik

katsayısı ile düzeltlmiş

belirginlik katsayısı

arasındaki ilişki

Ders notları

Uygulamalar tekrar edilmeli

240

Anahtar Kavramlar

Aralık Tahmini

Hipotez testi

Gauss Markov teoremi

Belirginlik Katsayısı

Düzeltilmiş belirginlik katsayısı

Regresyon Kareler Toplamı

Toplam değişme,

Hata Kareler Toplamı

241

Giriş

Bu bölümde daha önce basit regresyon modeli için gördüğümüz aralık tahminleri ve

hipotez testlerini çok değişkenli regresyon bağlamında tekrar edeceğiz. Ayrıca çok değişkenli

regresyonun uyumun iyiliği ölçüsü belirginlik katsayısının nasıl hesaplanacağını ele alacak ve

düzeltilmiş belirginlik katsayısını tanıtacağız.

242

9.1. En Küçük Kareler Tahmincilerinin Örnekleme Özellikleri

EKK tahmincileri 0 1 2, , rassal değişkenlerdir; farklı örneklerde farklı değerler alırlar

ve değerleri, bir örnek toplanana kadar ve değerleri hesaplanana kadar bilinmez. En küçük

kareler tahmincisinin örnekleme özellikleri, tahminlerin örnekten örneğe nasıl değiştiğini

gösterir. Bunlar, daha önceki derslerimizden de bilindiği üzere tahminlerin güvenilirliğini

değerlendirmede bir temel sağlar. Eğer model için 1-5 varsayımları sağlanırsa, en küçük kareler

tahmincisi sapmasızdır ve daha küçük bir varyansa sahip başka bir doğrusal sapmasız tahminci

yoktur. Bu sonuç, genel çok değişkenli regresyon modeli için doğru olmaya devam etmektedir.

Gauss Markov Teoremi: Çok değişkenli regresyon modeli için 1-5 varsayımları

sağlanırsa, EKK Tahmincileri parametrelerin en iyi (enküçük varyanslı), doğrusal, sapmasız

tahmincilerdir (BLUE).

Hataların normal dağıldığı varsayımı altında, Y de normal dağılan rassal değişkendir.

En küçük kareler tahmincileri de, Y’nin doğrusal fonksiyonları olduğu için normal olasılık

dağılımlarına sahip olacaktır. Hatalar normal dağılmazsa EKK tahmincileri, büyük örneklerde

yaklaşık olarak normal dağılacaktır. Burada “büyük ”den kastın ne olduğu karmaşıktır. Bu, her

ayrı uygulamaya özgü çok sayıda faktöre bağlıdır. Genelde, 𝑛 − 𝑘 = 50 ise yeterince büyük

sayılır. Normal veya yaklaşık olarak normal dağılım gösteren en küçük kareler tahmincilerine

sahip olmak, aralık tahminlerini oluşturmak ve regresyon modelindeki parametreler ile ilgili

hipotezleri test etmek için önemlidir.


Hata varyansını tahmin etmenin temel sebebi, en küçük kareler tahmincilerinin

bilinmeyen varyans ve kovaryanslarının bir tahminini elde etmeyi bize sağlamasıdır. Burada,

EKK tahmincisinin genel özellikleri bağlamında varyans ve kovaryansları ele alacağız.

En küçük kareler tahmincilerinin varyans ve kovaryansları, 0 1, ve 2 tahmincilerinin

güvenilirliği ile ilgili bilgi sağlar. EKK tahmincileri sapmasız olduğu için, daha küçük

varyanslar doğru parametre değerlerine “yakın” tahminler sağlama olasılığının daha yüksek

olması anlamına gelecektir. 0 1 1 2 2ˆ ˆ ˆˆ

i i iY X X için, en küçük kareler tahmincilerinin

varyans ve kovaryansları, aşağıdaki gibidir.

2 2 2 2

1 2 2 1 1 2 1 2 2

0 22 2

1 2 1 2

21ˆ i i i i

i i i i

X x X x X X x xVar

n x x x x

2 22 2

1 2 2 22 21 121 2 1 2

ˆ veya(1 )

i

ii i i i

xVar

x rx x x x

243

2 21 2

2 2 2 22 22 121 2 1 2

ˆ veya(1 )

i

ii i i i

xVar

x rx x x x

2

121 2

2 2 2

12 1 2

ˆ ˆ( , )(1 ) i i

rKov

r x x

Burada 12r , 1X ile 2X arasındaki örnek korelasyon katsayıdır.

1 2

12 2 2

1 2

i i

i i

x xr

x x

1 ’nin varyansını etkileyen faktörler aşağıdaki gibidir.

1. Hata terimi varyansının ( 2 ) büyük olması, EKK tahmincileri varyanslarının da büyük

olmasına yol açar. Bu beklenen durumdur, çünkü 2 model tanımlamasındaki tüm belirsizliği

ölçmektedir. 2 büyükse, veri değerleri regresyon fonksiyonu 0 1 1 2 2( )i i iE Y X X

etrafında geniş bir şekilde yayılacak ve verilerde, parametre değerleri ile ilgili daha az bilgi söz

konusu olacaktır. 2 küçükse, veri değerleri regresyon fonksiyonu 0 1 1 2 2( )i i iE Y X X

etrafında yoğun bir şekilde yayılacak ve verilerde, parametre değerlerinin ne olabileceği ile

ilgili daha fazla bilgi söz konusu olacaktır.

2. Daha büyük örnekler (n) ile çalışılması, EKK tahmincilerinin varyanslarının daha küçük

olmasını sağlar. Şöyle ki; n’nin daha büyük değeri, X deki değişmenin 2 2

1 1 1i iX X x değerinin daha büyük olması anlamına gelir. Bu terim, varyans formülünün paydasında yer alır

ve 2

1ix teriminin değeri büyük olduğunda, 1ˆVar küçük olur. Daha fazla gözlem, daha

kesin parametre tahmini sağlar.

3. Bağımsız bir değişkenin 2 2

1 1 1i iX X x ile ölçülen ortalama etrafındaki değişiminin

daha fazla olması EKK tahmincisinin daha küçük varyansa sahip olmasını sağlar. 1 ’yi hassas

bir şekilde tahmin etmek için 1X ’de daha fazla değişim istenir bir özelliktir. 1X ’de değişim

küçük olursa, değişimin etkisini ölçmek zordur. Bu zorluk, 1 için daha büyük varyans olarak

yansıtılacaktır.

4. 1X ile 2X arasındaki yüksek korelasyon, 1 ’nin varyansının da büyük olmasına yol açar.

Varyans formülünün paydasında 121 r vardır. 12r ’ün değeri 1’e yakınsa, 121 r küçük

olacak, bu da 1ˆVar ’nin büyük çıkmasına sebep olacaktır. Bu durum nedeni ise; 1X ’in

ortalaması etrafındaki değişim, diğer açıklayıcı değişkenlerdeki değişimle ilişkili olmadığında

tahmin kesinliğine daha fazla katkı yapar. Bir açıklayıcı değişkendeki değişim, diğer bir

244

açıklayıcı değişkendeki değişimle ilişkili olduğunda, onların farklı etkilerini ayrıştırmak zordur.

Doğrusal bağlantı ile adlandırılan bu durum EKK tahmincilerinin büyük varyansları olmasına

sebep olur.

En küçük kareler tahmincilerinin tahmin edilen varyans ve kovaryanslarını, matris

olarak isimlendirilen bir kare dizilimde düzenlemek gelenek olmuştur. Bu matrisde, köşegen

varyansları ve köşegen dışı unsurlar ise kovaryansları ifade eder.r. Varyans-kovaryans matrisi

veya daha basitçe kovaryans matrisi olarak isimlendirilir. k=3 iken, kovaryans matrisinde

varyans ve kovaryansların sıralaması aşağıdaki gibidir,

0 0 1 0 2

0 1 1 1 2

0 2 1 2 2

ˆ ˆ ˆ ˆ ˆ, ,

ˆ ˆ ˆ ˆ ˆ ˆ, ,

ˆ ˆ ˆ ˆ ˆ, ,

i

Var Cov Cov

Var Cov Cov Var Cov

Cov Cov Var

Varyans –Kovaryans matrisi simetrik bir matristir.


Bu aşamada İthalat modelindeki parametrelere uygulanacak hipotez testleri ve aralık

tahmini için gerekli olan parametrelerin varyansları tahmin edilecektir.

2 2 2 2

1 2 2 1 1 2 1 2 2

0 22 2

1 2 1 2

21ˆ î i i i

i i i i

X x X x X X x xVar

n x x x x

2 2

0 2

15 2 2 84 2 15 2 101ˆ 0.564 84 2 (10)

Var

150.9

2

2 2

1 22 2

1 2 1 2

ˆ î

i i i i

xVar

x x x x

1 2

2ˆ 0.5684 2 (10)

Var

0.01647

2

1 2

2 22 2

1 2 1 2

ˆ î

i i i i

xVar

x x x x

245

2 2

84ˆ 0.5684 2 (10)

Var

0.69176

0 1ˆ ˆ, ve 2 tahmin edilen varyanslarının karekökleri standart hatalarıdır. Hesaplanmış

standart hatalar gibidir:

0 150.9ˆ 12.28Se

1 0.01647ˆ 0.128Se

2 0.69176ˆ 0.832Se

Bu aşamaya kadar ulaştığımız sonuçları aşağıdaki gibi raporlayabiliriz.

1 2ˆ ˆ2.82 0.58 0.94 0.4907

ˆ( ) (12.28)(0.128) (0.832)

i

i

Y X X

Se

9.3. En Küçük Kareler Tahmincilerinin Dağılımı

Çoklu değişkenli regresyon modelinim 1-5 varsayımları geçerli ise, en küçük kareler

tahmincileri 0 1 2 1ˆ ˆ ˆ ˆ, , , , k

0 1 1 2 2 1 1i i i k ik iY X X X u

modelindeki 0 1 2 1, , , , k parametrelerinin, en iyi doğrusal sapmasız tahmincileri

olduğunu olduğu bilinmektedir.

Rassal hataların iu normal olasılık dağılımına sahip olduğu varsayımı da eklenirse, bu

durumda bağımlı değişken iY ’de normal olarak dağılır ve aşağıdaki gibi ifade edilir,

2 2

0 1 1 2 2 1 1 , 0,i i i k ik iY N X X X u

EKK tahmincileri, bağımlı değişkenin doğrusal fonksiyonu olduğu için, EKK

tahmincileri de normal olarak dağılım gösterir ve aşağıdaki gibi ifade edilir.

ˆ ˆ, ( )i i iN Var

246

Buna göre her î , i ortalama ve ˆ( )iVar varyans ile normal dağılıma sahiptir. Normal

rassal değişken î , ortalamasından çıkarılarak ve varyansının kareköküne bölünerek, aşağıda

ifade edilen, ortalaması sıfır ve varyansı 1 olan, standart normal değişken Z’ye dönüştürülebilir.

ˆ

0,1ˆ

i i

i

Z NVar

î ‘nın varyansı, yukarıda k=3 olduğu durumunda gösterildiği gibi, hata teriminin

bilinmeyen varyansına 2 bağlıdır. 2 yi, yukarıda elde edilen tahmincisi 2 ile yer

değiştirirsek, tahmin edilen îVar ’ı elde ederiz. Z’de ˆVar yerine ˆVar ’nın tahmini

yazılırsa, N(0,1) rassal değişkenini, bir t-rassal değişkenine dönüştürür. Yani aşağıdaki gibi

ifade edilebilir,

ˆ ˆ

ˆˆ

i i i in k

ii

t tSeVar

Bu sonuç basit regresyondakinden farkı t-rassal değişkenin serbestlik dereceleridir.

Basit regresyonda tahmin edilen parametre sayısı iki olduğu için serbestlik derecesi 𝑛 − 2 idi.

Bu bölümde, Çok değişkenli regresyon modelinde k sayıda bilinmeyen parametre vardır ve t-

istatistiği için serbestlik derecesi sayısı 𝑛 − 𝑘’dır.

9.3.1. Aralık Tahmini

Çok değişkenli regresyon modelinde yer alan parametrelerin aralık tahminlerindeki

prosedür basit regresyon modeli ile aynıdır. Sadece n k serbestlik derecesinde yer alan ve

parametre sayısı gösteren k değişecek buna bağlı olarak da kritik değer (eşik değer) olarak

isimlendirdiğimiz ct değişiklik gösterecektir. Basit regresyonda uygulanan yolu izleyerek

0.05 verilmişse n k serbestlik derecesine sahip olduğumuz anımsayarak

0.95c cP t t t

yazarız. Hatırlanacağı üzere 0.975,c n kt t

; n k

t dağılımının 97.5’lik yüzdelik dilimidir ( ct ’nin

solundaki alan veya olasılık, 0.975’tir) ve 0.025,c n kt t

, n k

t dağılımının 2.5’lik yüzdelik

dilimidir.)

Test istatistiği:

1 1

1

ˆ

ˆt

Se

247

olduğuna göre aralık tahmini için aşağıdaki ifade yazılır.

1 1

1

ˆ0.95

ˆc cP t tSe

Bu ifadeyi yeniden düzenlediğimize, aşağıdakini elde ederiz,

1 1 1 1 1ˆ ˆ ˆ ˆ 0.95c cP t Se t Se

Aralık bitiş noktaları aşağıdaki gibidir,

1 1 1 1ˆ ˆ ˆ ˆ,c ct Se t Se

Yukarıdaki aralık 1 ’nin %95 aralık tahmincisidir. Bu aralık tahmincisi, ana kütleden

elde edilen pek çok örnekte kullanılırsa, bunların %95’i doğru parametre 1 ’yi içerir.

Genel olarak, herhangi bir i ’nin 100 1 % güven aralığı için genel bir formülü

aşağıdaki gibi ifade edilir.

1 2, 1 2,ˆ ˆ ˆ ˆ,i i i in k n k

t Se t Se

9.3.2. Hipotez Testi

t-dağılımı sonucu, parametrelerin her biri ile ilgili hipotezleri test etme için bir temel

sağlar. Basit regresyondan bilindiği üzere c’nin belirlenmiş bir sabit olduğu 0 : iH c ’ye

karşı 1 : iH c şeklindeki hipotezler, çift-kuyruklu testler olarak isimlendirilir, 0 : iH c

’ye karşı 1 : iH c gibi eşitsizlikleri içeren hipotezler, tek-kuyruklu testler olarak

isimlendirilir. Bu bölümde, basit regresyonda olduğu gibi sadece çift kuyruklu testler ele

alınacaktır.

Çok değişkenli regresyon modeli oluşturulduğunda, modelde yer alan bağımsız

değişkenlerin ( 1 2 1, , , kX X X ) bağımlı değişkeni Y ’yi etkilediğine inanırız. Ancak bu etkinin

varlığının doğrulanması için; modelin veri ile desteklenip desteklenmediğinin incelenmesi

gerekir. Diğer bir ifade ile verilerin, Y ’nin her bir açıklayıcı değişken ile ilişkili olduğunu

gösteren bir kanıt sağlayıp sağlamadığı bilmemiz gerekir. Veri bir açıklayıcı değişken, örneğin

iX , Y ile ilişkili değilse 0i olacaktır. 0i temel hipotezi test etme bağımsız değişken iX

için anlamlılık testi olarak isimlendirilir

248

Anlamlılık sınaması için hipotez testinin aşamaları

1. Temel ve alternatif hipotezler,

0 1: 0H

1 1: 0H

2. Temel hipotez doğruysa, test istatistiği aşağıdaki gibidir.

1

1

ˆ

ˆ n kt t

Se

n:gözlem sayısı, k:parametre sayısı

3. %5 anlamlılık düzeyini (α=0.05) kullanarak ve 75 3 72n k serbestlik

derecesi olduğunu anımsayarak, dağılımın her bir kuyruğunda 0.025 olasılığını

sağlayan kritik değerler, 1 2:n kt

ve 2:n kt

. Bu sebeple,

4. 2. aşamada hesaplanan t-değeri, şu şekilde ise, 1 2:n k

t t

veya 2:n k

t t

temel

hipotezi reddederiz. Eğer 2: 1 2:n k n kt t t

ise, H0’ı reddedemeyiz

Bir parametre tahmininin anlamlılığının testi önemlidir. Parametrenin tahmini anlamlı

ise ilgili açıklayıcı değişkenin, modele dahil edilecek değişken olduğuna dair ön inancını

doğrular.

9.4. Uyum İyiliğinin Ölçülmesi: Belirginlik Katsayısı

Basit regresyon modeli için, bağımsız değişkenle açıklanan değişmenin toplam

değişmeye oranı ile ölçülen belirlilik katsayısını 𝑟2, çok değişkenli regresyon modeli için de

kullanılır aynı formüller geçerlidir. Belirlilik katsayısı aşağıdaki gibi hesaplandığı basit

regresyon modelinden bilinmektedir.

2 2

2

2 2

ˆ ˆ( )

( )

i i

i i

Y Y y RKTR

Y Y y BKT

veya

2 2

2

2 2

ˆ ˆ( )1 1 1

( )

i i i

i i

Y Y uHKTR

BKT Y Y y

Burada RKT, Y’deki toplam değişimin model ( regresyon kareler toplamı) tarafından

“açıklanan” kısmı, BKT, Y’nin ortalaması etrafındaki toplam değişimi ( bütün kareler toplamı)

ve HKT, EKK kalıntı (hata) kareler toplamı olup, Y’deki değişimin model tarafından

açıklanamayan kısmıdır.

249

îY simgesi, bağımsız değişkenlerin örnek değerlerinin her biri için Y’ nin öngörülmüş

değerini gösterir. îY aşağıdaki gibi ifade edilir.

0 1 1 2 2 1 1ˆ ˆ ˆ ˆˆ

i i i k ikY X X X

Model bir kesim terimi ( 0 ) içerdikçe, bağımlı değişkenin örnek ortalamasıY , hem

iY ’nin hem de Y ortalamasıdır ( ˆY Y )

Y için örnek standart sapması aşağıdaki gibi ifade edilebilir,

2 2

1 1

1 1( )

1 1 1

n n

Y i i

i i

BKTS Y Y y

n n n

ve böylece, 2( 1) YBKT n S olur.

Belirginlik katsayısı 0 ile 1 arasında değer alır. R2 nin değeri yükseldikçe regresyon

düzleminin örnek gözlemlerine uyumu artar. k-1 sayıda bağımsız değişkeni olan çok değişkenli

bir regresyon modeli için R2 formülünü genişletilirse;

2

1 1 2 2 1 12

2 2 2

ˆ ˆ ˆî i i i i k ik i

i i

y x y x y x yR

y Y nY

sonucuna ulaşılır. Bağımlı değişken üzerinde etkili olsun veya olmasın modele giren her

değişken belirginlik katsayısı R2 nin değerini arttıracaktır. Şöyle ki; R2 eşitliğindeki toplam

değişme(2

iy ) bağımsız değişkenlerden bağımsızdır ve değeri sabittir. Modele giren her

değişken regresyonla açıklanan değişmeyi (2îy ) arttıracaktır. Paydanın (

2

iy ) değeri sabit

iken payın (2îy ) değerinin artması belirginlik katsayısının yanıltıcı şekilde artmasına neden

olur. Bu mahsuru ortadan kaldırmak için çok değişkenli regresyon modellerinde genellikle R2

yerine düzeltilmiş R2hesaplanır. Düzeltilmiş belirginlik katsayısı 2R ile gösterilir ve

2 2 11 (1 )

nR R

n k

‘e eşittir. Düzeltilmiş R2( 2R ), belirginlik katsayısının serbestlik derecesiyle yeniden

düzenlenmiş halidir. Gözlem sayısı yeterince büyükse 2R ile R2 birbirine yakındır. Ancak

gözlem sayısı küçükse düzeltilmiş belirginlik katsayısı, belirginlik katsayısından daha küçüktür

( 2 2R R )hatta belirginlik katsayısı negatif değer almazken (orijinden geçen regresyon hariç) 2R negatif değer alabilmektedir. Belirsizlik katsayısı yine 1-R2‘ye eşittir.

Alternatif modellerin R2 kriterine göre karşılaştırılabilmesi için bağımlı değişkenin aynı

olması gerekir. Şöyle ki; aynı değişkenler arasındaki ilişkiyi açıklayan

250

0 1 1 2 2ˆ ˆ ˆˆ

i i iY X X

ile

0 1 1 2 2ˆ ˆ ˆˆln ln lni i iY X X

modelleri arasında tercih yapmak için R2 uygun bir ölçü değildir. Çünkü Y’deki toplam değişim

ile ln Y’deki toplam değişim aynı değildir.

Y ile X arasındaki ilişkinin derecesini gösteren basit korelasyon katsayısını (r), basit

regresyon modelinde belirginlik katsayısının ( 2r ) karekökünden elde etmenin mümkün

olduğunu biliyoruz. Çok değişkenli regresyon modelinde belirginlik katsayısının (R2) karekökü

çoklu korelasyon katsayısına eşittir. Çoklu korelasyon katsayısı da bağımlı değişken ile

bağımsız değişkenler arasındaki ilişkinin derecesini gösterir. Ancak kısmi korelasyon

katsayılarının işareti farklı olduğu için, belirginlik katsayısından hesaplanan çoklu korelasyon

katsayısına artı veya eksi işaret verilemez. Bu nedenden dolayı, uygulamada genellikle

belirginlik katsayısı hesaplanır ve yorumlanır.

251

Uygulamalar

252

Uygulama Soruları

1) 1 2ˆln 0.81 0.02ln 1.98lnY X X modelinin yorumu ile ilgili aşağıdakilerden

hangisi doğrudur?

a. 2X sabit iken 1X ’deki %1’lik artış Y’yi % 20 düşürür.

b. 1X sabit iken 2X ’deki %1 birimlik artış Y’yi % 1.98 birim artırır.

c. ln 2X sabit iken ln 1X ’deki %1 birimlik artış lnY’yi % 0.02 birim düşürür.

d. ln 2X sabit iken ln 1X ’deki %1 artış lnY’yi % 0.02 düşürür.

e. 2X sabit iken 1X ’deki %1’lik artış Y’yi % 0.02 düşürür.

2) 0 1 1 2 2ˆ ˆ ˆY X X modelinde 1 ’in varyans tahmincisi aşağıdaki gibidir.

2 22 2

1 2 2 22 21 121 2 1 2

ˆ(1 )

i

ii i i i

xVar

x rx x x x

Buna göre aşağıdakilerden hangisi yanlıştır.

a. Hata teriminin varyansının büyük olması 1 ’in varyansının büyük olmasına yol açar.

b. Gözlem sayısının büyük olması, 1 ’in varyansının küçük olmasını sağlar.

c. 1X ‘deki değişim (2

1 1( )iX X ) büyük ise 1 ’in varyansı da büyüktür.

d. 1X ile 2X arasındaki yüksek korelasyon 1 ’in varyansının büyük olmasına yol açar.

e. 2

121 r büyük ise 1 ’in varyansı da büyük tahmin edilecektir.

3-6 arası sorular aşağıa raporlarmış veriler göre cevaplandırılacaktır.

25 yıllık verilerden 1 2ˆ 0.69 1.372 0.902Y X X modeli tahmin edilmiştir. Modelinin

varyans-kovaryans matrisi aşağıdaki gibidir.

16 25 81

ˆ 25 9 49

81 49 4

iVar Cov


a) 1 ’in standart hatası 3’e eşittir.

253

b) 2 ’nin varyansı 4’e eşittir.

c) 0 ile 1 arasındaki ortak varyans (kovaryans) -25’e eşittir.

d) 0 ile 2 arasındaki ortak varyans (kovaryans) -49’a eşittir.

e) 0 ’nin varyansı 16’ya eşittir.

4) 0.10 düzeyinde 0 parametresi ile ilgili anlamlılık testi sonuçlarına ilişkin

aşağıdakilerden hangisi doğrudur.

a) Test istatistiğinin değeri: 0.1725, 1.717ct ,

0 istatistiksel açıdan anlamsız.

b) Test istatistiğinin değeri: 0.1725, 1.708ct ,

0 istatistiksel açıdan anlamsız.

c) Test istatistiğinin değeri: 5.80, 2.060ct ,

0 istatistiksel açıdan anlamlı.

d) Test istatistiğinin değeri: 0.1725, 2.074ct ,


e) Test istatistiğinin değeri: 5.80, 1.717ct ,


5) 0.10 düzeyinde 0 parametresi için oluşturulan güven aralıkları

aşağıdakilerden hangisidir?

a) (-3.749 ;11.824)

b) (-6.178;7.558)

c) (-1.945;8.896)

d) (3.6109; 9.801)

e) (2.725;10.175)

6) 0.05 düzeyinde 2 parametresi ile ilgili anlamlılık testi sonuçlarına ilişkin

aşağıdakilerden hangisi doğrudur.

a) Test istatistiğinin değeri: (-0.451), 2.074ct , 2 istatistiksel açıdan anlamsız

b) Test istatistiğinin değeri: (0.451), 2.074ct , 2 istatistiksel açıdan anlamlı.

c) Test istatistiğinin değeri: (-0.451), 2.074ct , 2 istatistiksel açıdan anlamlı.

d) Test istatistiğinin değeri: (0.451), 2.060ct , 2 istatistiksel açıdan anlamlı.

e) Test istatistiğinin değeri: (-0.451), 2.060ct , 2 istatistiksel açıdan anlamsız.

7-10 arası sorular aşağıdaki veriler kullanılarak cevaplandırılacaktır.

1 2 3ˆ 27.02 1.61 11.03 1.89Y X X X

254

1 2 35.8 , 2.7 , 12.94yx yx yx

2 273 4.1 12iY Y n

7) Regresyon ile açıklanan değişme aşağıdakilerden hangisidir?

a) 32.8

b) 1173

c) 21.44

d) 971.28

e) 14.66

8) Belirginlik katsayısının değeri nedir?

a) 0.21

b) 0.72

c) 0.42

d) 0.81

e) 1.05

9) Düzeltilmiş belirginlik katsayısının değeri nedir?

a) 0.69

b) 0.37

c) 0.75

d) -0.05

e) -0.09

10) Toplam değişme …….iken, modele giren her değişken regresyon ile ……….

değişmenin değerini….., ,bu nedenle çok değişkenli regresyon modelinde ……

yorumlanması uygundur.

a) sabit; açıklanabilen; attırır; düzeltilmiş belirginlik katsayısının

b) bağımlı değişenin değerine eşit; açıklanamayan; azaltır; düzeltilmiş belirginlik

katsayısının

c) sabit; açıklanabilen; azaltır; düzeltilmiş belirginlik katsayısının

d) regresyonla açıklanamayan değişmeye eşit; açıklanabilen; attırır; düzeltilmiş

belirginlik katsayısının

e) sabit; açıklanamayan; arttırır; düzeltilmiş belirginlik katsayısının

255


Bu bölümde çok değişkenli regresyon modellerinden en basiti olan iki bağımsız

değişkenli bir modelde tahmin edilen parametrelerin varyans ve kovaryanslarının nasıl

hesaplandığını gördük. Tahmin edilen parametrelerin dağılım özellikleri üzerinde durduk, çok

değişkenli regresyon modeli parametrelerinin de normal dağılıma uygunluk gösterdiğini

belirttik. Bu bağlamda basit regresyon modeli için uyguladığımız hipotez testleri ve güven

aralıklarının sadece serbestlik derecesindeki farklılıkla aynen çok değişkenli regresyon modeli

için de uygulanabildiğini örneklerle gösterdik. Ayrıca çok değişkenli regresyon modelleri için

regresyon doğrusunun verilere uyumu için belirginlik katsayısının güvenilir bir ölçü olmadığını

düzeltilmiş belirginlik katsayısının hesaplanarak yorumlanması gerektiğini belirttik.

256

Bölüm Soruları


a. Tahmin edilen parametrelerin varayns ve kovaryansları parametrelerinin

güvenirliliği hakkında bilgi sağlar.

b. Gauss Markow teoremine göre çok değişkenli regresyon modelinde temel

varsayımlar sağlanırsa, EKK tahmincileri en iyi doğrusal sapmasız tahmincilerdir.

c. Varyans kovaryans mtrisinin diagonal elemanları tahmin edilen parametrelerin

varyanslarını diagonal dışı elemanları kovaryansları verir.

d. Çok değişkenli regresyon modelinde tahmin edilen parametreler normal dağılıma

uygundur.

e. Hata teriminin varyansının büyük olması, tahmin edilen parametrelerin

varyanslarının küçük çıkmasını sağlar.

2) 20 gözlemlik verilerden aşağıdaki modelleri tahmin edilmiştir.

1. Model 2

1 2ˆln 3.09 1.62 0.89 0.56iY X X R

2. Model 2

1 3ˆ 23.09 0.71 5.61 0.72iY X X R

Her iki modelin düzeltilmiş belirginlik katsayısı ve hangi modelin tercih edileceği

aşağıdaki şıklardan hangisinde doğru verilmiştir?

a) 1. Model 2 0.51R , 2. Model 2 0.69R

Bağımlı değişkenlerdeki toplam değişme farklı olduğu için iki model karşılaştırılamaz.

b) 1. Model 2 0.61R , 2. Model 2 0.75R

Düzeltilmiş belirginlik katsayısı büyük olduğu için ikinci model tercih edilir.

c) 1. Model 2 0.61R , 2. Model 2 0.75R

Düzeltilmiş belirginlik katsayısı küçük olduğu için birinci model tercih edilir.

d) 1. Model 2 0.51R , 2. Model 2 0.69R

Düzeltilmiş belirginlik katsayısı büyük olduğu için ikinci model tercih edilir.

e) 1. Model 2 0.51R , 2. Model 2 0.69R

Düzeltilmiş belirginlik katsayısı küçük olduğu için birinci model tercih edilir.

3) 2

1 3ˆ 23.09 0.71 5.61 0.72iY X X R n=20 modelindeki 0.71 olarak tahmin

edilen parametrenin varyansı 0.04 ise 0.05 anlamlılık seviyesinde

parametrenin anlamlılığı için test istatistiğinin değeri, testin tablo değeri ve karar

aşağıdakilerden hangisidir.

a) t=3.55, tc=2.110, alternatif hipotez kabul, parametre anlamlı

b) t=17.75 , tc=1.740, temel hipotez kabul, parametre anlamlı

c) t=3.55 , tc=1.740, alternatif hipotez kabul, parametre anlamlı

d) t=0.06, tc=2.110, temel hipotez kabul, parametre anlamsız

e) t=3.55 , tc=2.110, temel hipotez kabul, parametre anlamsız

257

4) Aşağıdaki veriler göre düzeltilmiş belirginlik katsayısının değeri nedir? 2 2ˆ2951 399 17 4i iy u n k

a) 0.83

b) 0.87

c) 0.80

d) 0.71

e) 0.42

5) Belirginlik katsayısı ile düzeltilmiş belirginlik katsayısı arasında nasıl bir ilişki

vardır.

a) 2 2R R

b) 2 2(1 )R R

c) 2 2 1R R

d) 2 2R R

e) 2 21 (1 ) 1R R n k n

6) Alternatif modellerin belirginlik katsayısına göre karşılaştırabilmesi için

…………………olmalıdır.

a) Bağımlı değişken aynı biçimde ifade edilmiş

b) Fonksiyonel biçimi aynı

c) Bağımsız değişkenleri aynı

d) Gözlem sayısı aynı

e) Regresyon ile açıklanan değişme aynı olmalıdır.

7) Çok değişkenli regresyon modellerinde n=gözlem sayısı, k=parametre sayısı

olmak üzere hipotez testi ve güven aralıklarının oluşturulmasında kullanılan

serbestlik derecesi nedir?

a) n-(k-1)

b) (n-1)-(k-1)

c) (n-1)-(n-k)

d) n-k

e) n-2

8) 0 1 1 2 2i i i iY X X u modelinde 0 2: 0H temel hipotezine karşılık

1 2: 0H alternatif hipotezi sınamak için aşağıdaki ifadelerden hangisi

doğrudur?

a) Çift taraflı F testi

b) Çift taraflı ki-kare testi

c) Çift taraflı t testi

d) Tek taraflı t testi

e) Tek taraflı F sınaması

258

9) Belirginlik katsayısı 2R için aşağıdaki ifadelerden hangisi yanlıştır?

a) Düzeltilmiş 2R negatif değer alabilir.

b) Her zaman 2 1R

c) Modele eklenecek her yeni değişken 2R değerini arttırmaktadır.

d) Modele eklenecek her yeni değişken 2R değerini arttırmayabilecektir.

e) 0 1 1i i iY X u modeli için 1

22

,Y XR r geçerlidir; 1,Y Xr , korelasyon

katsayısıdır.

10) 0 1 1 2 2i i i iY X X u modelinde 2 parametresi için anlamalılık sınaması

yapıldığında temel ve alternatif hipotezler aşağıdaki şıklardan hangisinde doğru

olarak verilmiştir?

a) 0 2

1 2

: 0

: 0

H

H

b) 0 2

1 2

: 0

: 0

H

H

c) 0 2

1 2

: 0

: 0

H

H

d) 0 2

1 2

: 0

: 0

H

H

e) 0 2

1 2

: 0

: 0

H

H

Cevaplar

1) e

2) d

3) c

4) c

5) e

6) a

259

7) d

8) a

9) b

10)a

260

10. ÇOK DEĞİŞKENLİ REGRESYON MODELİNDE İLERİ

ÇIKARSAMA

261


10.1. Birleşik Hipotezlerin Testi

10.2. F-Testi

10.3. Modelin Anlamlılığının Testi

10.4. F- ve t- Testleri Arasındaki İlişki

10.5. Varyans Analiz (ANOVA) Tablosu

262


1) Kısıtlı ve kısıtsız model ne demektir?

2) F testi nasıl uygulanır?

3) ANOVA tablosu nasıl düzenlenir?

4) Regresyonun anlamlılığı nasıl test edilir?

263




Birleşik

Hipotezlerin Testi

Kısıtlı ve kısıtsız hata kareleri toplamı

kavramını ve hipotezleri test etmek için

nasıl kullanıldığını açıklayabilmek.

Ders notları tekrar edilmeli

Modelin

Anlamlılığının

Testi

Birleşik temel hipotezleri test etmek

için F-testini kullanabilmek.


tekrar edilmeli

Modelin

Anlamlılığının

Testi

Regresyon modelinin genel

anlamlılığını test edebilmek


tekrar edilmeli

Modelin

Anlamlılığının

Testi

Varyans Analiz Tablosunu oluşturmak

ve ne amaçla kullanıldığını bilmek


tekrar edilmeli

264

Anahtar Kavramlar

Kısıtlı Model

Kısıtsız Model

ANOVA tablosu

F testi

Kısıtlı modelin kalıntı kareler toplamı

Bileşik hipotez

Kısıtsız modelin kalıntı kareler toplamı

Kısıtlı en küçük kareler yöntemi

Örnek dışı bilgi

Regresyonun anlamlılığı

265

Giriş

İktisatçılar, iktisadi davranış ile ilgili teorileri geliştirir ve değerlendirirler.

Ekonometrisyenler ise iktisat teorisini ekonometrik model ile tahmin ederek, hipotez testleri ile

iktisat teorilerini test ederler. Çok değişkenli regresyon modelinden elde edilen tek parametre

i üzerine tek bir kısıttan oluşan temel hipotezler için t-testlerinin nasıl uygulanacağını

öğrenmiş bulunmaktayız. Bu dersimizde, önceki analizimizi, iki veya daha fazla parametre

üzerine kısıtları içeren temel hipotezin testini görecek ve bu bağlamda F-testinin nasıl

uygulanacağını göreceğiz

266

10.1. Birleşik Hipotezlerin Testi

Daha önceki bölümlerde tek bir parametre için hipotezlerin testi için çift-kuyruklu

testlerin nasıl kullanılacağını öğrenmiş bulunmaktayız. Tek bir parametre için hipotez testi,

sadece parametre ve parametre standart hatasının tahminini gerektirdiği için basittir.

Çit kuyruklu tüm t-testlerinin önemli bir özelliği, bir veya daha fazla parametre ile ilgili

tek bir tahmini içermesidir. Bu bölümde, parametreler ile ilgili çoklu tahminleri içeren temel

hipotezler doğru hipotez testini genişletme ile ilgileneceğiz. Birden fazla eşitlik işareti ile ifade

edilen çoklu tahminler ile ilgili temel hipotez, birleşik hipotez olarak isimlendirilir. Birleşik

hipotezin bir örneği, bir grup açıklayıcı değişkenin belirli bir modelde yer alıp almamasının test

edilmesidir. Bir ürün için talep edilen miktar, rakip malların fiyatlarına ( 1RMP , 2RMP ) mı

yoksa sadece kendi fiyatına ( P ) mı bağlıdır? Bunlar gibi iktisadi hipotezler, model

parametreleri ile ilgili formüllere dönüştürülmek zorundadır.

0 1 2 31 2i i i i iD P RMP RMP u

Temel hipotez tüm rakip malların fiyatlarının katsayılarının sıfıra eşit olması olacaktır.

0 2 0 3: 0 , : 0H H

veya

0 2 3: 0H

burada, 2 ve 3 ikame malların fiyatlarının katsayılarıdır. Yukarıdaki birleşik temel hipotez,

iki tahmin ( iki eşittir işareti) : 0 2: 0H ve

0 3: 0H olduğunu içerir. 0H testi, iki

tahminin aynı zamanda sağlanıp sağlanmadığı için bir birleşik testtir.

10.2. F-testi

Birleşik bir hipotezin test için F-testi kullanılmaktadır. Bu testi ve bununla ilgili

kavramları tanıtmak için, satış modeline reklam harcamaları karesinin de dahil edildiği

genişletilmiş model kullanılacaktır.

2

0 1 1 2 2 3 2i i i i iY X X X u

Reklam harcamalarının satışlar üzerinde etkili olup olmadığını test etmek istediğimizi

varsayalım. Reklam, hem bir doğrusal terim 2X hem de ikinci dereceden bir terim 2

2X olarak

modelde yer aldığı için, ancak 2 0 ve 3 0 ise reklam harcamalarının satışlar üzerindeki

etkisi olmayacaktır. 2 ve

3 sıfır olmadığında kısaca 2 0 ve

3 0 ise reklam harcamaları

satışlar üzerinde bir etkiye sahip olacaktır. Böylece, bu test için temel ve alternatif hipotezler


0 2 3: 0 , 0H ,

1 2 3, : 0 0H veya her ikisi de sıfır değil

267

Temel hipotez 0 2 3: 0 , 0H ‘a göre, yukarıdaki model kısıtsız model olarak

adlandırılır. Temel hipotezdeki kısıtlar, modele uygulanmamıştır. 0H ’daki parametre

kısıtlarının doğru olduğu varsayımıyla elde edilen yeni model ise kısıtlı model olarak

adlandırılır 𝐻0 doğru iken, 2 30 , 0 ,

2X ve 2

2X modelden çıkarılırsa, kısıtlı model

aşağıdaki gibi olur.

0 1 1i i iY X u

0 2 3: 0 , 0H hipotezinin testi için kullanılan F-testi, kısıtsız modelin ve kısıtlı

modelin hata kareleri toplamlarının ( en küçük kareler kalıntılarının kareli toplamları)

karşılaştırılmasına dayanır. Bu iki toplam için sırasıyla kısaca 2ˆ

KSZu ve

2ˆ

KSLu ile gösterilir.

Bir regresyona değişken veya değişkenlerin eklenmesi hata kareleri toplamını

azaltacaktır. Bağımlı değişkendeki değişme diğer bir ifade ile toplam değişme ( BKT ) modelde

yer alan bağımsız değişken sayısından bağımsız olup, sabittir. Modele giren her bağımsız

değişken regresyon ile açıklanan değişmeyi (RKT) arttıracağı için, kısıtsız modelin

kalıntılarının kareleri toplamı kısıtlı modelin kalıntılar kareleri toplamından küçük olacaktır.

Dolayısıyla kısaltmaları açısından, 2 2ˆ ˆ 0

KSZ KSLu u olur.

2 2ˆ ˆ

KSL KSZu u ise

2 2

KSL KSZR R olduğu sonucunu çıkarabiliriz.

Satış gelirleri için kısıtsız ve kısıtlı olmak üzere iki alternatif modelin tahmin sonuçları

ve kalıntı kareler toplamı aşağıdaki gibidir.

2

0 1 1 2 2 3 2i i i i iY X X X u 2ˆ 1532.084

KSZu

0 1 1i i iY X u 2ˆ 1896.391

KSLu

Dikkat edilirse, kısıtlı modelin hata kareleri toplamını kısıtsız modelin hata terimi

toplamından küçüktür.

F-testi bu azalmanın anlamlı olup olmadığını test etmektir. Ek değişkenleri ekleme, hata

kareleri toplamı üzerinde çok aza etkiye sahipse, bu değişkenler bağımlı değişkendeki değişimi

açıklamaya çok az katkı yapar ve onları modelden çıkaracak temel hipotez için destek oluşur.

Diğer yandan, eğer değişkenleri ekleme, hata kareleri toplamında büyük bir azalmaya

yol açarsa, bu değişkenler bağımlı değişkendeki değişimi açıklamaya anlamlı bir şekilde katkı

yapar ve temel hipoteze karşı kanıtımız olur. F-testi, hata kareleri toplamında büyük bir azalma

veya küçük bir azalmayı neyin oluşturduğunu belirler. Buna göre F-testi için test istatistiği


2 2

2

ˆ ˆ

ˆ

KSZKSL

KSZ

u u vF

u n k

veya

268

2 2

,21

KSZ KSL

v n k

KSZ

R R vF F

R n k

Burada, v kısıtlama sayısı, n gözlem sayısı ve k ise kısıtsız modeldeki parametre

sayısıdır.

Eğer temel hipotez doğruysa, F istatistiği, payda v serbestlik dereceli ve paydada n-k

serbestlik derece ile F-dağılımına sahip olur. Eğer temel hipotez doğru değilse, 2ˆ

KSZu ve

2ˆ

KSLu arasındaki fark büyük olacak ve temel hipotez ile modelde yer alan kısıtların modelin

verilere uyum sağlama kabiliyetini anlamlı bir şekilde azalttığı anlamına gelir. Böylece2 2ˆ ˆ

KSL KSZu u ’nin alacağı büyük değer, F değerinin de büyük olma eğiliminde olduğu

anlamına gelir. Buna göre F-testi istatistik değeri 0.01 ve 0.05 için v; n-k serbestlik

dereceli kritik değer cF ’den büyük olursa, temel hipotez reddedilir.

2X ve 2

2X değişkenleri satış modelinden çıkarılmalı mıdır yoksa modelde kalmalı

mıdır?’ın testi için F-testinin aşamaları aşağıdaki gibidir:

1. Temel ve alternatif hipotezi belirlenmesi: Birleşik temel hipotez ve alternatif

hipotez aşağıdaki gibidir.

0 2 3: 0 , 0H

1 2 3: 0 veya 0 H veya her ikisi de sıfır değil

veya

0 2 3: 0H

1 : Enaz biri sıfırdan farklı dır.H

2. Temel hipotez doğruysa, test istatistiği: 0H ’da iki kısıt olduğu için v=2’dir.

n=75 olduğuna göre, 0H doğru olduğu varsayımı altında F-testi istatistiğinin dağılımı


2 2

2,712

ˆ ˆ 2

ˆ 75 4

KSL KSZ

KSZ

u uF F

u

3. Anlamlılık düzeyi oluşturularak red bölgesi belirlenir. Anlamlılık düzeyi 0.05

alınır ise 2,71F dağılımından elde edilen kritik değer,

0.95,2,71cF F olup, F’in red bölgesi ≥

3.126’dır.

4. Test istatistiğinin örnek değeri hesaplanır. F-testi istatistik değeri aşağıdaki gibidir.

1896.391 1532.084 2

8.441532.084 75 4

F

5. Karar aşaması: 8.44 3.126cF F olduğu için, 2 0 ve 3 0 olduğu temel

hipotezi reddedilir ve bunlardan en az birinin sıfırdan farklı olduğu sonucuna ulaşılır. Reklam,

satış hasılatı üzerinde anlamlı bir etkiye sahiptir.

269

10.3. Modelin Anlamlılığının Testi

F-testi için önemli bir uygulama, bir modelin genel anlamlılığının test edilmesidir.

Hatırlanacağı üzere toplam değişme içinde regresyonla açıklanan değişmenin payını gösteren

belirginlik katsayısı 2R ’nin bir istatistik olduğunu ve test edilmesi gerektiği ifade edilmişti. F-

testi ile bir modelin genel anlamlılığının test edilmesi esasen 2R ’nin testidir.

Bağımlı değişken Y’nin, belirli bir açıklayıcı değişken Xi ile ilişkili olup olmadığının

testi için t-testi kullanıldı. Şimdi bu test tüm açıklayıcı değişkenlerin anlamlılığının birleşik

testi için genişletilecektir. Tekrar, k sayıda parametre ve k-1 sayıda değişken için çok değişkenli

regresyon modelini aşağıdaki gibidir.

0 1 1 2 2 1 1i i i k ik iY X X X u

Uygun bir açıklayıcı modele sahip olup olmadığımız incelemek için, aşağıdaki temel ve

alternatif hipotezler kurulur.

0 1 2 1: 0kH

1; iH ’lerdan en az biri sıfırdan farklıdır. 1,2, , 1i k için,

Bu hipotezler aşağıda verilen temel ve alternatif hipotezlere denktir.

2

0 : 0H R

2

1; 0H R

Temel hipotez, k-1 bileşene sahip olduğu için, birleşik hipotezdir. Temel bileşik hipotez

0 otonom parametre hariç, i parametrelerinin her biri ve tümünün aynı zamanda sıfır

olduğunu göstermektedir. Eğer bu temel hipotez doğruysa, açıklayıcı değişkenlerin hiçbirisi

bağımlı değişken Y’yi etkilemez ve böylece, modelimizin çok az değeri vardır veya hiçbir

değeri yoktur. Eğer alternatif hipotez 1H doğruysa, parametrelerden en az biri sıfırdan farklıdır

ve böylece bir veya daha fazla açıklayıcı değişken modelde yer almaktadır. Ancak alternatif

hipotez, hangi değişkenlerin içerilebileceğini göstermez. Bu test ile uygun bir açıklayıcı modele

sahip olup olmadığımız test ettiğimiz için, bu test regresyon modelinin genel anlamlılığının testi

olarak da bilinmektedir. Sonuç olarak, tek bir temel hipotezi test etmek için t-testi kullanılmakta

iken, birleşik temel hipotezinin testi için F-testi kullanılmaktadır. Kısıtsız model

0 1 1 2 2 1 1i i i k ik iY X X X u

iken, temel hipotez doğru iken, kısıtlı model aşağıdaki gibi olacaktır.

0i iY u

Bu kısıtlı modelde 0 ’ın en küçük kareler tahmincisi aşağıdaki gibidir.

270

* 1ˆ

n

i

i

Y

Yn

Buna göre * , bağımlı değişkenin örnek ortalamasına eşittir. Bu 0i iY u bağımsız

değişkenlerden hiçbirinin yer almadığı model için hata karelerinin toplamı aşağıdaki gibidir.

2 2*

1 1

ˆn n

i i

i i

HKT Y Y Y BKT

Regresyonun anlamlılığının testi için test istatistiği aşağıdaki gibidir.

2 2

2

ˆ 1

ˆ

i i

i

y u kF

u n k

Bu test istatistiğinin hesaplanan değeri, 1,k n k

F

dağılımından elde edilen bir kritik

değer ile karşılaştırılır. Testin sonucu, regresyon analizi için temel öneme sahiptir.

Satış gelirleri uygulaması için regresyonun genel anlamlılığını testi, 1X ,

2X ve 2

2X

değişkenleri ile ilgili parametrelerin birlikte sıfır olup olmadığının, bu parametrelerden en az

birinin sıfırdan farklı olduğu alternatif hipotezine karşı testidir. Buna göre testin aşamaları


1. 0 1 2 3: 0H

temel hipotezi

1 1 2 3; , , ' ün en az biri sıfırdan farklıdır.H

alternatif hipotezine karşı test edilmektedir.

2. 0H doğru ise, F test istatistiği aşağıdaki gibidir.

2 2

3,712

ˆ 4 1

ˆ 75 4

i i

i

y uF F

u

3. %5 anlamlılık düzeyini kullanarak, serbestlik derecesi (3, 71) ile, F-istatistiği için

kritik değerini 𝐹𝑐 = 2.734 buluruz. Böylece, 𝐹 ≥ 2.734 olursa, 𝐻0’ı reddederiz.

4. Gereken karelerin toplamı, 2 3115.482iy ve 2ˆ 1532.084iu ki bu F-değeri

aşağıdaki gibidir,

2 2

2

ˆ 1 3115.482 1532.084 4 124.459

ˆ 1532.084 75 4

i i

i

y u kF

u n k

271

5. 24.459 2.734 olduğu için, 𝐻0 reddederiz ve tahmin edilen ilişki anlamlı bir

ilişkidir. Fiyat, satışlar ve satışların karesinin en azından biri satışlar üzerinde bir etkiye sahip

olduğuğ sonucuna ulaşırız.

10.3. F- ve t- Testleri Arasındaki İlişki

Yukarıda2 0 ve

3 0 olup olmadığını test etmek için bir F-testi kullanarak,

reklamın, satışları etkileyip etkilemediğini test ettik.

2

0 1 1 2 2 3 2i i i i iY X X X u

Varsayalım ki, şimdi, fiyatların satışları etkileyip etkilemediğini test etmek istiyoruz.

Yukarıda uyguladığımız F-testinin aşamalarını aynı şekilde uygulayacağız.

0 1 1 1: 0 , : 0H H ve kısıtlı model aşağıdaki gibidir,

2

0 2 2 3 2i i i iY X X u

Kısıtlı ve kısıtsız model tahmin edilerek her iki model için de kalıntı kareler toplamı

hesaplanır. Bunlar sırasıyla, ˆ 1532.084KSZ

u ve ˆ 2683.411KSL

u ′e eşittir.

Gerekli F-değeri aşağıdaki gibidir,

2 2

2

ˆ ˆ 2683.411 1532.084 153.355

1532.084ˆ

KSL KSZ

KSZ

u u vF

u n k

%5 kritik değer, 0.95,71

3.976cF F ’dır. 53.355 3.976cF F böylece,

0 1: 0H reddedilir.

Tek bir “eşitlik” temel hipotezini ( tek bir kısıtlama), “eşit değildir” alternatif hipotezine

karşı test ederken, ya t-testi ya da F-testi kullanılabilir; bu test sonuçları özdeş olacaktır. Bu

uyumun sebebi, t- ve F-dağılımları arasındaki tam ilişkidir. df serbestlik derecesi ile t rassal

değişkenin karesi, paydaki 1 serbestlik derece ile ve paydadaki df serbestlik derece ile bir F

rassal değişkenidir. 𝐹(1,𝑑𝑓) dağılımına sahiptir.

t-testini ile 0 1: 0H karşı

1 1: 0H test etmek için aşağıda raporlanmış tahmin

sonuçları kullanılmaktadır.

2

1 2 2109.72 7.640 12.151 2.768

ˆ( ) (6.80) (1.046) (3.556) (0.941)

i i i i

i

Y X X X

Se

0 1: 0H karşı 1 1: 0H test için t-değeri, 7.640 1.046 7.30444t ’dür. Bunun

karesi, 22 7.30444 53.355t dir ki bu değer, yukarda hesaplana F-değeri ile aynıdır. t-testi

272

için %5 kritik değer, 𝑡𝑐 = 𝑡(0.95,2,71) = 1.9939 olup, karesi, 𝑡𝑐2 = 1.99392 = 3.976 = 𝐹𝑐, -ki

bu F-testi için kritik değerdir. Bu tam ilişkiler sebebiyle, kullandığımız yaklaşım ne olursa

olsun, her zaman aynı sonuca ulaşacağımız anlamına gelir. Ne var ki, tek-kuyruklu t-test

kullanırken, eşdeğerlik yoktur çünkü alternatif hipotez, > veya < gibi bir eşitsizlik olduğunda

F-testi, uygun değildir. t-testleri ve F-testleri arasındaki özdeşlik, temel hipotez, tek bir kısıttan

fazlasından oluştuğunda devam etmez. Bu şartlar altında, 𝑣 ≥ 2, t-testi kullanılamaz, fakat F-

testi mevcuttur.

F-testinin bileşenleri aşağıdaki gibi özetlenebilir:

1. Temel hipotez 𝐻0 , model parametreleri 𝛽𝑖 üzerine bir veya daha fazla eşitlik

kısıtlarından oluşur. Kısıt sayısı, v ile gösterilir. v= 1 olduğunda, temel hipotez, tekli

temel hipotez olarak isimlendirilir. v≥ 2 olduğunda, birleşik temel hipotez olarak

isimlendirilir. Temel hipotez, herhangi “daha büyük veya eşittir” veya “ daha küçük

veya eşittir” hipotezlerini içermeyebilir.

2. Alternatif hipotez, temel hipotezde bir veya daha fazla eşitliklerin doğru olmadığını

ifade eder. Alternatif hipotez, herhangi bir “daha büyük” veya “ daha küçük”

seçeneklerini içermeyebilir.

3. Test istatistiği, F-istatistiğidir.

4. Temel hipotez doğruysa, F, paydaki vserbestlik derecesi ve paydadaki n-k serbestlik

derecesi ile F-dağılımına sahiptir. Temel hipotez, 𝐹 > 𝐹𝑐 olursa, reddedilir, burada

𝐹 = 𝐹(1−𝛼,𝑣,𝑛−𝑘) , F-dağılımının üst kuyruğında olasılık yüzdesini 𝛼 bırakan kritik

değerdir.

5. Tek bir eşitlik temel hipotezini test eerken, ya t- veya F-testi posedürünü kullanmak

mükemmel bir şekilde doğrudur: Bunlar eşittirler. Uygulamada, tekli kısıtlarını test

etmek için, t-testi kullanımı yaygındır. F-testi genelde, birleşik hipotezler için

kullanılır.

10.4. Varyans Analiz (ANOVA) Tablosu

Özellikle çok değişkenli regresyon modelleri açısından önemli olan analizi yaklaşımı

aynı verilere uygulanan alternatif modellerin seçiminde yol göstericidir. Aynı zamanda

belirginlik katsayısı, tahminin standart hatası, bağımlı değişkenin koşulsuz varyansı gibi

ölçülerin varyans analiz tablosunda hesaplanması mümkündür. Varyans analiz tablosunun

oluşturulmasındaki amaç regresyon ile açıklanan değişim anlamını test etmektir. Varyans

analiz tablosunu oluşturmak için toplam değişme, regresyon ile açıklanan değişme ve regresyon

ile açıklanamayan değişme arasındaki ilişkiyi bir kez daha yazalım.

2 22 ˆ ˆ

i i i iY Y Y Y Y Y

veya

2 2 2ˆ î i iy y u

273

BKT RKT HKT

Yukarıdaki değişimler ile ilgili unsurlar kullanılarak varyans analiz tablosu oluşturulur.

Değişimin

Kaynağı

Kareler Toplamı

KT

Serbestlik derecesi

sd

Ortalama

Kareler Toplamı

OKT

RKT 2îy k-1 2ˆ 1iy k

HKT 2îu n-k 2ˆ

iu n k

BKT 2

iy n-1 2 1iy n

Tablo: Varyans analiz (ANOVA) tablosu

Varyans analiz tablosunu kullanarak regresyon ile açıklanan değişmenin anlamlık testi

için aşamalar aşağıdaki gibidir.

1. Temel ve alternatif hipotezler aşağıdaki gibi kurulur.

0 1 2 1: 0, 0, , 0kH

1; iH ’lerdan en az biri sıfırdan farklıdır. 1,2, , 1i k veya

2

0 : 0H R

2

1; 0H R

2. 0H doğru ise test istatistiği aşağıdaki gibidir.

2

1,2

ˆ 1' nın

ˆ' nın

i

k n k

i

y kRHK OKTF F

KHT OKT u n k

3. Verilen bir anlamlılık düzeyini kullanarak 1,k n k serbestlik derecesi ile F-

istatistiği için kritik değerinicF bulunur.

4. Örnek verilerinden F değeri hesaplanır.

5. cF F olursa, 𝐻0 ’ı reddederiz. Böylece regresyon modelinde yer alan bağımsız

değişkenler değişkenler bağımlı değişken Y’yi açıklamada istatistiksel açıdan anlamlıdır.

Ayrıca yukarıdaki gibi hazırlamış ANOVA tablosunun Birici sütunun ilk satırının (2îy ) üçüncü satıra ( 2

iy ) oranından belirginlik katsayısı elde edilir. İkinci satırın son

elemanı ( 2îu n k ) tahminin standart hatasını verir. Üçüncü satırın son elemanı (

2 1iy n ) bağımlı değişkenin koşulsuz varyansıdır. ANOVA tablosunu üçüncü sütunun

birinci ikinci sıra unsurlarının oranı ise hesaplanan F değeridir.

274

Açıklayıcı Uygulama: Tüketim Modeli

Örneklem 1 verileri kullanılarak aşağıdaki ara sonuçlar kullanılarak;

n=10 1211Y 1700iX 2 322000iX 226020i iY X 170X 121.1Y

2 33000ix 2 12926.9y 20150i iy x

aşağıdaki regresyon modeli tahmin edilmişti.

ˆ 17.29 0.61i iY X

Şimdi yukarıdaki ara sonuçlar ve tahmin edilen regresyon modeli kullanılarak ANOVA

tablosunu düzenleyecek ve bu tablodan çıkarımlar elde edeceğiz. Öncelikle teorik varyans

analiz tablosunu aşağıdaki gibi hazırlıyoruz.

Değişimin

Kaynağı

Kareler Toplamı

KT

Serbestlik derecesi

sd

Ortalama

Kareler Toplamı

OKT

RKT 2îy k-1 2ˆ 1iy k

HKT 2îu n-k 2ˆ

iu n k

BKT 2

iy n-1 2 1iy n

Öncelikle yukarıdaki verileri kullanarak kareler toplamları hesaplanır.

BKT= 2 12926.9y ara sonuçlarda verilmiş,

Basit regresyonda regresyonla açıklanan kareler toplamı

RKT= 22 2 2ˆˆ 0.61 33000 12279.3i iy x

Not: Model k değişkenli model olsa idi, regresyon ile açıklanan değişmenin

2

1 1 2 2ˆ ˆ ˆˆ

i k ky x y x y x y eşitliğinden hesaplanması gerektiğini hatırlayın.

Buradan kalıntı kareler toplamı

BKT-RKT=HKT= 2ˆ 12926.9 12279. 647.63iu

olarak hesaplanır. k=4 , n=10 olduğuna göre varyans analiz tablosu aşağıdaki gibi düzenlenir.

275

Değişimin

Kaynağı

Kareler Toplamı

KT

Serbestlik derecesi

sd

Ortalama

Kareler Toplamı OKT

RKT 12279.3 2-1=1 12279.3 1 12279.3

HKT 647.6 10-2=8 647.6 8 80.95

BKT 12926.9 10-1=9 1 1436.3222926.9 9

Düzenlenen bu varyans analiz tablosundan aşağıdaki sonuçlara ulaşabiliriz.

1. Hata terimi varyansının tahmini: 2 2ˆ ˆ 80.95iu n k

2. Belirginlik katsayısı: 2 2 2 12279.3ˆ 12926.9 0.95i ir y y

veya

2 2 2ˆ1 1 647.6 12926.9 0.95i ir u y

3. Bağımlı değişken Y’nin koşulsuz varyansı

Var(Y)=1436.322

4. Regresyonun anlamlılığını ( 2r ’nin anlamlılığını) test edebiliriz.


0 1

1 1

: 0

: 0

H

H

veya

2

0

2

1

: 0

: 0

H r

H r

Test istatistiği

2

1,2

ˆ 1

ˆ

i

k n k

i

y kF F

u n k

olduğuna göre varyans analiz tablosunun son sütunu kullanılarak F istatistiğinin değeri

hesaplanır ve tablo değeri ile karşılaştırılır.

0.05,1,8151.6

12279.3

80.9899 5.32

5F F

Bu sonuca göre 1H hipotezi kabul edilir ve regresyon ile açıklanan değişme

veya 2r istatistiksel açıdan anlamlıdır. Gelir tüketim üzerinde etkilidir.

276

Uygulamalar

277

Uygulama Soruları

1) Aşağıda ara sonuçları kullanarak kısıtlı ve kısıtsız modelin hangisinin uygun model

olduğuna karar veriniz?

1 2ˆ 2.301 7.20 3.91i i iY X X

2 0.884R

2ˆ 945KSLy 2ˆ 233KSLu n=35

1 2 3 4ˆ 14.82 4.08 2.954 0.105 0.529i i i i iY X X X X

2 0.898R 2ˆ 973KSZy

2ˆ 105KSZu

Öncelikle bileşik temel ve alternatif hipotez aşağıdaki gibi belirlenir.

0 3 4: 0 , 0H

1 3 4: 0 veya 0 H veya her ikisi de sıfır değil

Temel hipotez doğruysa, test istatistiği: 0H ’da iki kısıt olduğu için v=2’dir. n=35

olduğuna göre, 0H doğru olduğu varsayımı altında F-testi istatistiğinin dağılımı aşağıdaki

gibidir.

,

ˆ ˆ

ˆ

KSL KSZ

v n k

KSZ

u u vF F

u n k

Test istatistiğinin örnek değeri hesaplanır. F-testinin istatistik değeri aşağıdaki gibidir.

233 105 2

105 421.3333

0 53F

Anlamlılık düzeyi 0.05 alınır ise 2,30

F dağılımından elde edilen kritik değer,

0.95,2,30cF F olup, F’in red bölgesi ≥ 3.32’dir. 21.33 3.126cF F olduğu için, 4 0 ve

5 0 olduğu temel hipotezi reddedilir ve bunlardan en az birinin sıfırdan farklı olduğu

sonucuna ulaşılır. Kısıtsız model Y bağımlı değişkenini açıklamada kısıtsız modele tercih

edilir.

278

2) Önceki derslerimizde İthalatın, GSMH ve ithal malları fiyat indeksinin

fonksiyonu olduğu model aşağıdaki ara sonuçlardan

1 1 1

2 2 2

2 22

22 2 2

1 1 1

22 2 2

2 2 2

1 2 1 2 1 2

280 4 15 4 40

36 4 2 4 20

84 4 4 20

984 4 15 84

18 4 2 2

130 4 15 2 10

i i i i

i i i i

ii

i i

i i

i i i i

y x Y X nX Y

y x Y X nX Y

y Y nY

x X nX

x X nX

x x X X nX X

2

1 2ˆ ˆ2.94 0.58 0.94 0.2408i iY X X u

olarak tahmin edilmişti. Regresyon ile açıklanan değişmenin anlamlılığını test edelim.

Öncelikle temel ve alternatif hipotezler aşağıdaki gibi kurulur.

0 1 2: 0H

1 1 2; , 'nin en az biri sıfırdan farklıdır.H

0H doğru ise, F test istatistiği aşağıdaki gibidir.

2 2

1,2

ˆ 1

ˆ

i i

k n k

i

y u kF F

u n k

%5 anlamlılık düzeyini kullanarak, k-1=3-1=2 ve n-k=4-3=1 ‘den (2,1) serbestlik derecesi ile

200cF ‘e eşittir.

Gereken karelerin toplamı, 2 20iy ve 2ˆ 0.2408iu ki bu F-değeri aşağıdaki gibi

hesaplanır.,

20 0.2408 3 1

0.2408 4 1123.0847F

123.0847 200 olduğu için, 𝐻0 reddedilemez ve tahmin edilen ilişki istatistiksel

olarak anlamlı değildir. İktisat teorisine göre ithalat, GSMH ve İthal malları fiyat endeksinin

fonkiyonu olmasına rağmen bu uygulamada GSMH ve İthal malları fiyat endeksi ithalatı

açıklamada yetersiz kalmışlardır. Bunun nedeni daha önce ifade edildiği üzere gözlem sayısının

4 ile sınrlı tutulmuş olmasıdır.

279

3-10 arası sorular aşağıdaki varyans analiz tablosu (ANOVA) kullanılarak

cevaplandırılacaktır.

ˆ 13.89 92.47i iY X

Değişimin

Kaynağı

Kareler Toplamı

KT

Serbestlik derecesi

sd

Ortalama

Kareler Toplamı

OKT

RKT 8552.73 1 8552.73

HKT 337.27 8 42.159

BKT 8890.00 9 987.7778

3) Belirginlik katsayısını hesaplayınız.

2 855 . 3ˆ 2 7iy ve 2 8890iy olarak verildiğine göre

2

2

2

8552.730.96

8890

î

i

yr

y

Bağımlı değişkendeki toplam değişmenin %96 sı X bağımsız değişkeni tarafından

açıklanmaktadır.

4) Hata terimi varyansını tahmini nedir? 2 42 59ˆ .1

5) Bağımlı değişkenin koşulsuz varyansı nedir?

( ) 987.7778Var Y

6) Tahminin standart hatası nedir?

42. 59ˆ 1 6.49

7) Regresyon ile açıklanan değişmenin ( 2r ’nin) anlamlılığını test edin.


0 1: 0H

1 1: 0H

Test istatistiğinin değeri

2 2

2

8890.00 337.27ˆ 1 2202

1

ˆ.8696

337.2 0 27 1

i i

i

y u kF

u n k

0.01 için kritik değer 1,8

11.3cF F ’dür

280

202.87 11.3cF F olduğu için 0H hipotezi reddedilir. Regresyon ile açıklanan

değişme ( 2r ) istatistiksel açıdan anlamlı bulunmuştur.

8) X katsayısı için t- testi uygulamaya gerek var mıdır?

Basit regresyon için t-testi ile F-testi birbielerine alternatif testler olup aynı sonucu verir.

Dolayısıyla ayrıca t-testi uygulamaya gerek yoktur.

9) F-istatistiğinin hesaplanmış değerinden t-istatistiğinin değerini bulabilirmisiniz?

2F t eşitliğinden

2202.87 t

t-istatistiğinin değeri aşağıda verilmiştir.

14.24t

10) 1 parametresinin standart hatasını hesaplayabilir misiniz?

Evet hesaplayabiliriz. t-istatistiği

1

1

ˆ

ˆt

Se

olduğuna göre,

1

92.4714.24

ˆSe eşitliğinden,

1ˆ 6.49368Se olarak bulunur.

281


Bu bölümde Kısıtlı ve kısıtsız model arasında F – testini kullanarak nasıl tercih

yapacağımızı, bu bağlamda bileşik hipotezin ne olduğunu öğrendik. Daha önceki derslerimizde

belirginlik katsayısının bir istatistik olduğunu, yüksek belirginlik katsayısının regresyon

doğrusuna uyumunun iyi olduğu anlamına gelmediğini ve test edilmesi gerektiği üzerinde

durmuştuk. Bu dersimizde belirginlik katsayısının diğer bir ifade ile regresyon ile açıklanan

değişmenin anlamlılığının testini gördük. Ayrıca varyans analiz tablosunun nasıl

düzenlendiğini ve varyans analiz tablosundan belirginlik katsayısı, hata terimi varyansı, bağımlı

değişkenin koşulsuz varyansının hesaplanması ve regresyon ile açıklanan değişmenin nasıl test

edileceği üzerinde durduk. Basit regresyon modelinde t testi ile F testinin birbirlerine alternatif

testler olduğunu ve F-testi uygulanmış ise, ayrıca t- testini uygulamaya gerek olmadığını

gösterdik.

282

Bölüm Soruları

14 gözlemlik verilere ilişkin ara sonuçlar, regresyon modelinin tahmini aşağıda verilmiştir.

1 2ˆ 24.7747 2.9415 0.0424i i iY X X

2

5937iY Y , 2

ˆ 5257iY Y

1-10 arası sorular yukarıdaki veriler kullanılarak cevaplandırılacaktır.

1) Varyans analiz tablosunu düzenleyiniz.

Değişimin

Kaynağı

Kareler Toplamı

KT

Serbestlik derecesi

sd

Ortalama

Kareler Toplamı

OKT

RKT

HKT

BKT

2) Ana kütle hata teriminin varyansı nedir?

a) 2628.5

b) 61.82

c) 456.6923

d) 42.52

e) 73.80

3) Belirginlik katsayısı nedir?

a) 0.12

b) 0.72

c) 0.89

d) 0.05

e) 0.57

283

4) Hata terimi varyansının tahmini nedir?

a) 61.82

b) 680

c) 2628.5

d) 456.69

e) 5937

5) Sırasıyla toplam değişme, regresyonla açıklanan değişme ve regresyon ile

açıklanamayan değişmenin değeri nedir?

a) 5257, 680, 5937

b) 680, 5257, 5937

c) 5937, 680, 5257

d) 5937, 5257, 680

e) 680, 5937, 5257

6) Regresyon ile açıklanan değişmenin anlamlığının testi için temel ve alternatif

hipotezler hangisidir?

a) 0 1 2: 0H


b) 0 0 1 2: 0H

1 0 1 2; , , 'nin en az biri sıfırdan farklıdır.H

c) 0 0 1 2: , , 'nin en az biri sıfırdan farklıdırH

1;.H 0 1 2 0

d) 0 1 2: , 'nin en az biri sıfırdan farklıdırH

1;H 1 2 0

e) 0 1 2:H


284

7) Regresyon ile açıklanan değişmenin sırasıyla serbestlik derecesi, F-istatistiğinin

değeri, 0.05 anlamlılık düzeyinde kritik değer ve karar nedir?

a) (2,11) ; 42.52; 3.98 ; 1H kabul

b) (2,11) ; 5.76; 19.4 ; 0H kabul

c) (2,11) ; 5.76; 19.4 ; 1H kabul

d) (2,11) ; 42.52; 3.98 ; 0H kabul

e) (11,13) ; 0.14; 2.79 ; 0H kabul

8) Yukarıdaki regresyon modeline 3 4 5, ,X X X ilave ediliyor ve kalıntı kareler

toplamı 220 hesaplanıyor. Kısıtlı ve kısıtsız modeller için temel ve alternatif

hipotezler aşağıdakilerden hangisidir.

a) 0 0 1 2: 0H


b) 0 3 4 5: 0H


c) 2

0 : 0H R

2

1 : 0H R

d) 0 0 1 2:H

1 0 1 2: 0H

e) 0 3 4 5: 0H

1 3 4 5: 0.H

9) 8. Sorudaki veriyi de kullanarak kısıtlı model ve kısıtsız modelden hangisini

seçeceğiniz hususunda serbestlik derecesi, test istatistiğinin değeri, 0.05

anlamlılık düzeyinde kritik değer ve karar nedir?

a) (3,11) ; 10.67; 8.76; 1H Kabul

b) (6,8) ; 3.98; 4.15; 0H Kabul

c) (8,6) ; 11.09; 4.15; 1H Kabul

d) (3,8) ; 8.36; 8.85; 0H Kabul

e) (3,11) ; 5.98; 8.76; 0H Kabul

285


a) Birden fazla hipotezin birlikte testi bileşik test olarak adlandırılır.

b) Regresyonla açıklanamayan değişmenin testi belirginlik katsayısının testine

denktir.

c) Basit regresyon için t- testi ile F- testi sonucu aynıdır.

d) Basit regresyon için t-istatistiği değerinin karesi F-istatistiğinin değerine eşittir.

e) Varyans analiz tablosu ile regresyon ile açıklanan değişmenin anlamlılığı test

edilebilir.

Cevaplar

1) c

2) b

3) c

4) a

5) d

6) a

7) d

8) b

9) d

10) b

286

11. OTOKORELASYON

287


11.1. Otokorelasyon nedir?

11.2. Otokorelasyonun sebepleri

11.3. Otokorelasyonun sonuçları

11.4. Otokorelasyonun test edilmesi

288


1) Otokorelasyon nedir?

2) Otokorelasyonun varlığında EKK tahmincilerin özellikleri nedir?

3) Otokorelasyon nasıl tespit edilir?

289




Otokorelasyon

nedir?

Otokorelasyonun ne anlama geldiğini ve

otokorelasyonun varlığı halınde EKK

tahmincilerinin özelliklerini kavramak

Ders notları

Otokorelasyonun

test edilmesi

Durbin Watson testini uygulabilmek Ders notları, uygulamaları

tekrar etmeli

Otokorelasyonun

test edilmesi

Durbin-h testini uygulabilmek Ders notları, uygulamaları

tekrar etmeli

Otokorelasyonun

test edilmesi

Durbin’in Alternatif testini uygulabilmek Ders notları, uygulamaları

tekrar etmeli

Otokorelasyonun

test edilmesi

Sıra testini uygulabilmek Ders notları, uygulamaları

tekrar etmeli

Otokorelasyonun

test edilmesi

Breusch-Godfey Testini uygulayabilmek Ders notları, uygulamaları

tekrar etmeli

290

Anahtar Kavramlar

Yardımcı regresyon

Otokorelasyon

Durbin Watson testi

Durbin h testi

Durbin’in alternatif testi

sıra testi, Breusch-Godfey Testi

1. dereceden otokorelasyon

p.dereceden otokorelasyon

291

Giriş

Klasik doğrusal regresyon modelinin temel varsayımlarından biri rassal hata

terimlerinin birbirleriyle ilişkisiz olmasıdır. Özellikle zaman serisi verilerin kullanıldığı

modellerde karşılaşılan otokorelasyon ekonometrinin hızla gelişen zaman serleri analizine

temel teşkil eder. Kesit verilerinin kullanıldığı modellerde verilerin dizilişi herhangi bir sıra

takip etmediği için otokorelasyon sorunu, bu tür veriler ile çok fazla ilgili değildir.

Otokorelasyon daha önce ele aldığımız model kurma hatası, değişen varyans gibi varsayımdan

sapma olduğu için tahmin edilen modelin aleyhine sonuçlar doğurur. Bu dersimizde

otokorelasyonun sonuçları verilecek, otokorelasyonun tespiti için kullanılan testlerden bazıları

tanıtılacak ve otokorelasyonun varlığının tespit edilmesi durumunda modelin tahmini için

kullanılacak tahmin yöntemleri verilecektir.

292

11.1. Otokorelasyon Nedir?

Klasik doğrusal regresyon modelinin temel varsayımlarında biri hata terimleri arasında

ilişkinin olmamasıdır ve aşağıdaki gibi gösterilir.

, , , 0i j i j i jE u u X X E u u i j

Herhangi bir gözleme ait hata terimi başka bir gözleme ait hata terimini etkiliyorsa temel

varsayımdan sapma söz konusu olup, modelde otokorelasyon sorunu vardır.

, 0i jE u u i j

Genellikle zaman serisi verilerinin kullanıldığı modellerde karşılaşılan otokorelasyon

problemine,

- Model dışında bırakılan bağımsız değişken

- Modelin fonksiyonel biçiminin yanlış belirlenmesi

- Gecikmeli ilişkiler

- Konjonktür ve şok etkisi

neden olmaktadır.

Hata terimleri arasında 1. dereceden otokorelasyon

1t t tu u v

ile gösterilir ve kısaca AR(1) ile ifade edilir. AR(1) modelde bir dönem önceki hata

terimi cari dönem hata terimini etkilemektedir. Ana kütle otokorelasyon katsayısı ( )

1 1

1

t t t t

t t

E u E u u E u

Var u Var u

ile gösterilir. Klasik doğrusal regressyon modelinin temel varsayımlarından ilki hata

teriminin beklenen değeri sıfıra eşitliği bilindiğine göre

1 0t tE u E u

eşitliğini yazabiliriz. Ayrıca yine klasik doğrusal regresyon modelinin varsayımlarından

biri önceki bölümde detaylı ele alınan hata terimi varyansının gözlemler itibariyle sabit

olduğudur. Buna göre aşağıdki eşitliği yazabiliriz.

1t tVar u Var u

Böylece ana kütle otokorelasyon katsayısı

1

1

,t t

t

E u u

Var u

293

AR(1) modelin eğim katsayısıdır ve 1 1 arasında değer alır.

Bu bağlamda AR(2) model aşağıdaki gibi gösterilir.

1 1 2 2t t t tu u u v

AR(2) modelde hata terimi bir ve iki dönem önceki değerleri ile ilişkilidir. Genel olarak

AR(p) ise,

1 1 2 2t t t p t p tu u u u v

ile sembolize edilir.

11.2. En Küçük Kareler Tahmincileri İçin Otokorelasyonun Sonuçları

Otokorelasyonun varlığı halinde EKK tahmincileri sapmasız, tutarlı ancak en küçük

varyanslı değildir. Ana kütle hata teriminin varyansının tahmini ( 2 2ˆ ˆtu n k )

olduğundan küçük tahmin edilmiştir. Tahmin edilen parametreler sapmasız olmasına karşın

parametrelerin varyanslarının tahmini sapmalıdır. Belirginlik katsayısı olduğundan büyüktür. t-

ve F testleri artık geçersizdir. Bu testler otokorelasyonun varlığı halinde tahmin edilen

parametrelerin istatistiksel açıdan anlamlılıkları hususunda ciddi yanıltıcı sonuçlar verecektir.

11.3. Otokorelasyonun Tespit Edilmesi

11.3.1. Sistematik Olmayan Test: Kalıntı Grafikleri

Aşağıdaki şekilde kalıntı grafiklerine bakıldığında birincisinde pozitif ikincisinde

otokorelasyonun olduğu görülmektedir.

294

11.3.2. Sistematik Testler

11.3.2.1. Sıra (Run) Testi

Sıra testi tesadüfiliğin araştırılması için parametrik olmayan bir testtir. Tesadüfilik,

kalıntıların dizilişi ile ilgili bir kavramdır. Birbirini izleyecek şekilde ardarda dizilen veriler

tesadüfi iseler birbirlerini etkilemeyeceklerdir. Herhangi bir nedenle tesadüfi değil iseler,

birbirlerini etkileyeceklerdir.

Sıra testinin uygulama aşamaları aşağıdaki gibidir. İlk aşamada temel ve alternatif hipotez

aşağıdaki gibi oluşturulur.

0

1

: 0 (otokorelasyon yoktur)

: 0 (otokorelasyon vardır)

H

H

1n =( + ) işaretli kalıntı sayısı

2n = (- ) işaretli kalıntı sayısı

1 2n n n

k = birbirini takip eden işaret sayısı

olmak üzere >20n ise birbirini takip eden işaretlerin sayısı (k), aşağıdaki ortalama ve

varyansla normal dağılmaktadır.

Ortalama:

1 2 1 2

1 2

2 2 ( ) 1 1

n n n nE k

n n n

Varyans:

2 1 2 1 2 1 2 1 2 1 2

2 2

1 2 1 2

2 (2 - - ) 2 (2 - )

( ) ( -1) 1k

n n n n n n n n n n n

n n n n n n

Normal dağılımın özellikleri kullanılarak k ’nın güven aralığı aşağıdaki gibi

oluşturulur.

Prob 1.96 1.96 0.95k kE k k E k

Oluşturulan güven aralığının birbirini takip eden işaret sayısını ( k ) içerme olasılığı

%95’dir. k belirlenen sınırlar içerisinde ise, kalıntıların diziliş rassaldır, modelde

otokorelasyon yoktur.

295

Açıklayıcı Örnek

Tahmin edilen bir regresyon modelinden hesaplanan kalıntılar aşağıda verilmiştir. Sıra

testini uygulayarak otokorelasyonun varlığını araştıralım.

Yıllar 1980 1981 1982 1983 1984 1985 1986 1987

îu -1.21 -1.12 -0.79 -1.14 -0.89 -1.42 -0.29 0.23

Yıllar 1988 1989 1990 1991 1992 1993 1994 1995

îu 0.99 2.23 2.75 2.16 2.54 2.16 2.65 1.42

Yıllar 1996 1997 1998 1999 2000 2001 2002 2003

îu 1.44 0.26 0.95 0.24 -2.04 -4.51 -2.87 -4.08

Temel ve alternatif hipotezler:

0

1

: 0 (otokorelasyon yoktur)

: 0 (otokorelasyon vardır)

H

H

Kalıntıların işaretleri sıralanır.

(- - - - - - -)(+ + + + + + + + + + + + +) (- - - -)

1 13 n (+) işaretli kalıntı sayısı

2 11 n (-) işaretli kalıntı sayısı

1 2 13 11 24 20n n n

(-), (+) ve (-) olmak üzere birbirini takip eden kalıntı işareti sayısı

3k

belirlendikten sonra 3k için ortalama ve varyansı hesaplayabiliriz.

1 2

1 2

2 2 13 11( ) 1 1

13 12.92

11

n nE k

n n

2 1 2 1 2 1 2

2

1 2 1 2

2

2 (2 - - )

( ) ( -1)

2 13 11 2 13 11 13 115,6561

13 11 13 11 1

k

n n n n n n

n n n n

2 5.6561 2.378k k

k için %95 güven aralığı oluşturulur.

Prob 1.96 1.96 0.95k kE k k E k

296

Prob 12.92 1.96 2.378 12.92 1.96 2.378 0.95k

12.92 1.96 2.378 (8.2593,17.5779)

3 k yukarıdaki aralığın dışındadır. Bu sonuca göre alternatif hipotez kabul edilir,

kalıntıların dizilişi rassal değildir ve modelde otokorelasyon vardır.

11.3.2.2. Durbin Watson Testi

Otokorelasyonun varlığını test etmek amacıyla kullanılan birçok test olmasına rağmen

en çok kullanılan Durbin-Watson (DW) testidir. Durbin-Watson testinin kullanılmasında dikkat

edilmesi gereken bazı durumlar mevcuttur, bunlar:

- Orijinden geçen regresyon modellerine DW testi uygulanmaz. Modelde bir

sabitin olması gerekmektedir.

- Testin uygulanabilmesi için hata terimleri arasında 1t t tu pu e-= + ile ifade

edilen birinci dereceden otokorelasyon AR(1) olması gerekmektedir.

.

- DW testi bağımlı değişkenin gecikmeli değerlerinin açıklayıcı değişken olarak

yer aldığı otoregresif modellerde kullanılamamaktadır. Aşağıda

0 1 1 2 2 3 4 5 11 1 2 1t t t t tt tY X X X X Y u

olarak ifade edilen modelde bağımlı değişkenin cari dönemdeki değeri ( tY ), bağımsız

değişkenlerin gecikmeli değerlerinin ( 1 1t

X

ve 2 1t

X

) yanı sıra kendi bir dönem önceki

değerinden (1tY ) de etkilenmektedir. Böyle bir model gecikmeli bir modeldir, fakat kendi

gecikmeli değeri de modelde bağımsız değişken olarak yer aldığından dolayı aynı zamanda

otoregresif bir modeldir. Modelde bağımlı değişkenin gecikmeli değerleri bulunuyorsa, diğer

bir ifade ile model otoregresif bir modelse bu durumda otokorelasyonun test edilebilmesi DW

testi kullanılamaz.

- DW testinin uygulanabilmesi için modellerde eksik gözlem olmamalıdır.

Durbin-Watson testi için temel ve alternatif hipotezler aşağıdaki gibidir.

0

1

: 0

: 0

H

H

297

DW test istatistiği ise

2

1

2

2

1

ˆ ˆ

ˆ

t n

t t

t

t n

t

t

u u

DW

u

veya

2 1DW p

ile verilir.

Otokorelasyon katsayısı p, -1 ile 1 arasında değer alır , 1 1p . Buradan hareketle

2 1DW p olduğuna göre,

1p ise, 4DW negatif otokorelasyon vardır.

0p ise 2DW = otokorelasyon yoktur.

1p ise 0DW pozitif otokorelasyonun vardır.

Buna bağlı olarak DW; 0 4DW aralığında değer alabilmektedir. Anlaşılacağı üzere

DW değerinin 2’ye yakın bir değer alması modelde otokorelasyon olmadığına işaret etmektedir.

DW test istatistiğinin değeri hesaplandıktan sonra alt sınır ( dL) ve üst sınır ( dU)

kritik değerlerin yer aldığı DW kritik değer tablosundan bulunarak karşılaştırma yapılır ve

otokorelasyonun varlığına varsa negatif mi yoksa pozitif mi olduğuna karar verilir. Kritik

değerlere bakılırken modelde yer alan bağımsız değişken sayısı ( 'k ) esas alınmaktadır.

Hesaplanan DW istatistiği değeri; ( dL) ( dU) değerleri arasına veya ( 4-dU) ile ( 4-dL) değerleri

arasına düşerse otokorelasyonun olup olmadığı konusunda karar verilemez. Bu değer aralıkları

kararsızlık bölgeleri olarak bilinir. Bu durumda alternatif otokorelasyon testleri kullanmamız

298

gerekmektedir. DW değeri; 0 ile ( dL) arasına düşerse otokorelasyon vardır ve pozitif

otokorelasyondur. Değer; ( 4-dL) ile 4 arasında ise yine otokorelasyon vardır fakat negatif

otokorelasyondur.


50 gözlemlik verilerden aşağıdaki regresyon modeli tahmin edilmiş ve DW test

istatistiğinin hesaplanan değeri ise 1.43’e eşittir. DW testini kullanarak otokorelasyonun

varlığını test edelim.

1 2 3 4

ˆ 2.03 0.49 0.82 16.07 4.06tY X X X X

Temel ve alternatif hipotezler aşağıdaki gibi kurulur.

0 : 0H (Otokorelasyon yoktur.)

1 : 0 veya >0H (Pozitif otokorelasyon vardır.)

0.05 anlamlılık düzeyinde 4 bağımsız değişken sayısı ( ' 4k ) için kritik değerler

1.378Ld ve 1.721Ud ’e eşittir.

Hesaplanan DW değeri otokorelasyonun olmadığını ifade eden bölgeye düştüğü için H0

hipotezi reddedilemez. Modelde otokorelasyon yoktur.

11.3.2.3. Durbin-h testi

Daha önce de ifade edildiği gibi DW testi otoregresif modellerde kullanılamamaktadır.

Bağımlı değişkenin gecikmeli değerleri modelde bağımsız değişken olarak yer alıyorsa

299

otokorelasyonun varlığını tespit etmek amacıyla Durbin-h testi kullanılmaktadır. Durbin-h için

temel ve alternatif hipotezler aşağıda verilmiştir.

0 : 0H (Otokorelasyon yoktur)

1 : 0H (Otokorelasyon vardır)

Durbin-h test test istatistiği ise;

ˆ1

nh p

nVar

ile formüle edilir. Buradaki n gözlem sayısı, p otokorelasyon katsayısının tahmini,

( )ˆVar b ise bağımlı değişkenin gecikmeli değerine ait parametrenin varyansıdır.

Durbih – h istatistiğinin dağılımı asimptotik olarak normal dağılıma uygundur

ve bu test büyük örnekler için geçerlidir. Durbin h testi de DW testi gibi 1. dereceden

otokorelasyonun varlığının testinde kullanılır. Fakat ˆ.var( ) 1n b ³ ise bu test kullanılamaz.

Böyle bir durumda Durbin’in alternatif testi kullanılır. h istatistiği normal dağılıma uygun

olduğu için bir sonraki aşamada istatistik değeri 2Za değeri ile karşılaştırılır.

h istatistik değeri; 2Za± aralığında ise temel hipotez kabul edilir ve otokorelasyonun

olmadığına karar verilir. 2h Za> + ise pozitif otokorelasyon, 2h Za< - ise negatif

otokorelasyon var olduğu sonucuna varılır. Anlaşılacağı gibi son iki durumda H1 hipotezi kabul

edilmiştir.


Aşağıda tahmin sonuçları verilen modelde otokorelasyonun varlığını test edelim.

1ˆ 0.759 14.58 1.17 2.90 31

ˆ( ) (0.88) (5.77) (0.081)

t t tY X Y DW n

Se

Model otoregresif bir model olduğu için, otokorelasyonun varlığının testi için DW testi

kullanılamaz, Durbin-h testini kullanmamız gerekmektedir.

300

Temel ve alternatif hipotezler yazılır.

0

1

: 0

: 0

H

H

Test istatistiği değerinin hesaplanabilmesi için,

ˆ1

nh p

nVar

öncelikle 2 1DW p ilişkisinden otokorelasyon katsayısının tahmini ( p

)değerinin elde edilmesi gerekir.

2 1DW p

2.90 2 1 0.45p p

Buradan hareketle h test istatistiğinin değeri elde edilir.

2

310.45 2.84

1 31 0.081h

Dikkat edileceği gibi gecikmeli değişkene ait parametrenin varyansını elde etmek için,

parametre standart hatasının(0.081)

karesi alınmıştır. Hesaplanan istatistik değeri

2.84 1.96- < - olduğu için modelde otokorelasyon vardır ve negatif otokorelasyondur.

11.3.2.4. Durbin’in Alternatif Testi

Otokorelasyonun varlığı araştırılan model, otoregresif bir model ise DW testi yerine

Durbin-h testinin kullanılması gerektiğini öğrenmiş bulunmaktayız. Ancak test istatistiğinde

yer alan ˆ 1nVar ise, kök içi negatif değer alacağı için Durbin h testi ile otokorelasyonun

varlığı araştırılamaz. Söz konusu durumda parametrik bir test Durbin’in alternatif testi

kullanılır. Durbin’in alternatif testinin aşamaları kısaca aşağıdaki gibidir.

Temel ve alternatif hipotezler yazılır.

301

0

1

: 0

: 0

H

H

Otokorelasyonun araştırıldığı modelin (0 1 2 1ˆ ˆ ˆˆ

t t tY X Y ) kalıntıları ( ˆtu )

hesaplanır ve kalıntıların bağımlı değişken olduğu yardımcı regresyon kurulur. Kalıntıların bir

dönem önceki değerlerine (1

ˆtu

) açıklayıcı değişken olarak yer aldığı yardımcı regresyon

aşağıda verilmiştir.

0 1 2 1 3 1

ˆ ˆt t t t tu X Y u v

Tahmin edilen yardımcı regresyonda 1

ˆtu

ile ˆtu arasında ilişki kuran

3 parametresi

istatistiksel açıdan anlamlı bulunursa, hata terimleri rasında birinci dereceden otokorelasyonun

varlığına karar verilir. 3 parametresinin anlamlılık testi için temel ve alternatif hipotezler;

0 3

1 3

: 0

: 0

H

H

Temel hipotezin doğru olduğu varsayımı altında test istatistiğinin verilen bir

anlamlılık düzeyinde n-k serbestlik derecesi ile t dağılımına uygunluk gösterdiği önceki

derslerimizden bilinmektedir. Aşağıda verilen test istatistiğinden

3

3

ˆ

ˆ n kt t

Se

hesaplanan değer, kritik değerden c n k

t t

büyük ise birinci dereceden

otokorelasyonun varlığını işaret eden alternatif hipotez kabul edilir.


Aşağıda verilen modelde I yatırımları, GSYİH gayri safi yurt içi hasılayı, r faiz oranının

göstermektedir.

10.78 0.672 0.04 0.941 19

ˆ (0.002)(0.036) (0.0051) (0.2513) 2.18

t t t t

i

I GSYİH r I n

Se DW

Yatırım

fonksiyonunda otokorelasyonun varlığını araştıralım. Raporlanmış regresyon sonuçlarında DW

test istatistiğinin değeri verilmiş, ancak modelde 1tI açıklayıcı değişken rolü üstlendiği için

kullanılmaz. Durbin-h test istatistiğinin değerinin hesaplamadan önce ˆ 1nVar şartının

gerçekleşme durumunu araştıralım.

2ˆ 19 0.2513 1.20 1nVar

302

Otokorelasyon testi Durbin-h’ın da kullanılmayacağı anlaşılmıştır. Durbin’in alternatif

testinin kullanılması gerekir, bu amaçla kalıntılar elde edilir ve tahmin edilen regresyon modeli


1 1

ˆ ˆ14.78 1.408 0.006 1.206 0.639

ˆ (0.00672)(0.006) (0.0001) (0.0913) (0.313)

t t t t t

i

u GSYİH r I u

Se

1ˆ

tu ’nın

katsayısı 4 ’ün anlamlılık testi için temel ve alternatif hipotezler kurulur.

0 4

1 4

: 0

: 0

H

H

Test istatistiğinin değeri hesaplanır.

4

19 5

4

ˆ

ˆt t

Se

4

4

ˆ 0.6392.0415

ˆ 0.313t

Se

Hesaplanan test istatistiğinin değeri, 0.05 anlamlılık düzeyinde 19-5=14 serbestlik derecesi ile

kritik değer 14 2.145c n k

t t t

’den küçüktür, 4 istatistiksel olarak anlamsızdır. Böylece

yatırım modelinde birinci dereceden otokorelasyonun varlığı reddedilir, temel hipotez kabul

edilir.

11.3.2.5. Breusch-Godfey Testi (LM Test)

Buraya kadar gördümüz otokorelasyon testleri hata terimleri arasında birinci dereceden

olduğu varsayılan otokorelasyonun varlığının araştırılmasına yönelikti. Ancak p. dereceden

otokorelasyonun varlığının testinde önceki testler kullanılmaz.

0 1 1 2 2 3 3t t t t tY X X X u modelinde p. dereceden otokorelasyonun testi için

Breusch-Godfey testi kullanılır. Testin aşamaları kısaca aşağıdaki gibidir.

Temel ve alternatif hipotezler kurulur.

0 1 2

1 1 2

: 0

: 0

p

p

H

H

Temel hipotez p. dereceden otokorelasyonun olmadığı, alternatif hipotez ise p.

dereceden otokorelasyonun olduğu anlamına gelir.

İkinci aşamada otokorelasyonun varlığının araştırıldığı modelin kalıntıları hesaplanır ve

bu kalıntıların bağımlı değişken olarak yer aldığı yardımcı regresyon tahmin edilir. Yardımcı

regresyonda otokorelasyonun varlığının araştırıldığı modeldeki bağımsız değişkenlerin yanı

sıra p gecikme için kalıntılar yer alır.

303

0 1 1 2 2 3 3 4 1 5 2ˆ ˆ ˆ ˆ

t t t t t t k t p tu X X X u u u v Yardımcı

Regresyon tahmin edilir ve belirginlik katsayısı hesaplanır. Gözlem sayısı ile belirginlik

katsayısının çarpımına eşit test istatistiği p serbestlik derecesi ile ki-kare dağılır.

2 2

pnR

Test istatistiğinin değeri verilen bir anlamlılık düzeyinde 2 2

c p değerinden büyük

ise modelde p. dereceden otokorelasyon olduğunu gösteren alternatif hipotez kabul edilir.


0.89 0.1295t tY X modelinde ikinci dereceden otokorelasyonun varlığını

araştırmak amacıyla aşağıdaki yardımcı regresyon tahmin edilmiştir.

2

1 2ˆ ˆ ˆ1.27 0.597 5.3 8.1 21 0.72t t t tu X u u n R

Otokorelasyonun varlığı hakkında kararınız nedir?


0 1 2

1 1 2

: 0

: 0

H

H

Test istatistiğinin değeri:

2 21 0.72 15.12nR

0.05 anlamlılık düzeyinde tablo değeri 2 2

2 5.991c ’dir.

Test istatistiğinin hesaplanan değeri tablo değerinden büyük olduğu için 0H hipotezi

reddedilir, 1H hipotezi kabul edilir. Modelde 2. dereceden otokorelasyon vardır.

11.3.3. Otokorelasyonun Varlığı Durumunda Parametre Tahmin

Yöntemleri

Otokorelasyonun varlığı halinde kullanılacak parametre tahmin yöntemleri:

-Birinci derece farklar yöntemi

-Genelleştirilmiş farklar yöntemidir.

Bu dersimizde tahmin yöntemlerinin sadece neler olduğu verilmiştir. Bu konuda daha fazla

okuma yapmak isteyen öğrencilerimiz Ekonometri kitaplarına başvurabilir.

304

Uygulamalar

305

Uygulama Soruları

1) 2006:I-2012:IV dönemine ilişkin turizm gelirlerinin GSYİH’ya etkisinin

araştırıldığı regresyon modelinin tahmininden hesaplanan kalıntıların

işaretlerinin dizilişi aşağıdaki gibidir.

tu |

Otokorelasyonun varlığı hakkında ne söyleyebilirsiniz?

Kalıntıların işaretleri verildiğine göre sıra (run) testini uygulayabiliriz. Birinci

dereceden otokorlasyonun varlığının araştırıldığı sıra testinin temel ve alternatif hipotezler


0

1

: 0

: 0

H

H

İkinci aşamada (+ ) ve (-) işaretli kalıntıların sayısı tespit edilir.

1 16 n (+) işaretli kalıntı sayısı

2 12 n (-) işaretli kalıntı sayısı

1 2 16 12 28 20n n n için sıra testi uygulanabilir.

Üçüncü aşamada 4k için ortalama ve varyans hesaplanır.

1 2

1 2

2 2 16 12( ) 1 1

16 1214.71429

n nE k

n n

2 1 2 1 2 1 2

2

1 2 1 2

2

2 (2 - - )

( ) ( -1)

2 16 12 2 16 12 16 12

16 12 16 12 16.45805

k

n n n n n n

n n n n

2 6.45805 2.5412k k

Dördüncü aşamada k için %95 güven aralığı oluşturulur.

14.71429 9.733534 19.69501.96 2.5412 ( , 4)

Son aşama karar aşamasıdır. 4 k yukarıdaki aralığın dışındadır. Bu sonuca göre

alternatif hipotez kabul edilir, kalıntıların dizilişi rassal değildir ve modelde 1.dereceden

otokorelasyon vardır.

306

2) Aşağıda sonuçları raporlanmış regresyon modeli ve otokorelasyonun varlığının

araştırılması amacıyla yardımcı regresyon modeli verilmiştir.

1 2 -1

2

0,89 1, 203 0,86 4,12

ˆ ( ) (1, 26) (0,89) (0,001) (1,02)

2,89 0,54 10

t t t t

i

Y X X Y

SE

DW R n

Yardımcı regresyon 2 2

1 2 -1 -1ˆ ˆ2,01 3,09 - 4,98 0,6 5,12 0,89

ˆ( )(1.94) (2.83) (3.65) (0.015) (4.81)

t t t t tu X X Y u R

Se

Otokorelasyonun varlığı hakkında karar veriniz.

Modelde bağımlıdeğişkenin gecikmeli değeri -1 tY yer aldığı için DW testi,

ˆ( ) 10 (1.02) 10.404 1nVar olduğu için Durbin-h testi de kullanılamaz. Yardımcı

regresyon sonuçlarından yararlanılarak Durbin’in alternatif testi kullanılmalıdır. Bu amaçla

1

ˆtu

’nın katsayısı 4 ’ün anlamlılık testi için

1ˆ

tu ’nın katsayısı

4 ’ün

anlamlılık testi için temel ve alternatif hipotezler kurulur.

0 4

1 4

: 0

: 0

H

H

Test istatistiğinin değeri hesaplanır.

4

10 5

4

ˆ

ˆt t

Se

4

4

ˆ 5.121.06

ˆ 4.81t

Se

Hesaplanan test istatistiğinin değeri, 0.05 anlamlılık düzeyinde 10-5=5 serbestlik

derecesi ile kritik değer 510 5

2.571ct t t

’den küçüktür, 4 istatistiksel olarak

anlamsızdır. Böylece birinci dereceden otokorelasyonun varlığı reddedilir, temel hipotez kabul

edilir.

3) Aşağıdaki verilen sonuçlara göre otokorelasyonun varlığı hakkında

ne söyleyebilirsiniz?

2 2

1

ˆ 20.858 1.942 17

ˆ ˆ ˆ23.491 42.140

t t

t t t

Y X n

u u u

Öncelikle DW test istatistiğinin hesaplanması gerekir.

307

2

1

2

ˆ ˆ 23.4910.557451

ˆ 42.140

t t

t

u uDW

u

Test istatistiğinin değeri 2’den küçüktür, otokorelasyon varsa negatif

otokorelasyondur. Buna göre temel ve alternatif hipotezler;

0

1

: 0

: 0 ( veya 0)

H

H

Durbin-Watson tablosundan 0.05 anlamlılık düzeyinde ' 1k için

1.133Ld , 1.381Ud ’e eşittir.

0.557451 1.133LDW d için modelde pozitif otokorelasyon vardır.

4) Aşağıdaki verilen sonuçlara göre otokorelasyonun varlığı hakkında ne

söyleyebilirsiniz?

1 2ˆ 0.61 1.049 0.065 10 3.39t t tY X X n DW

Test istatistiğinin değeri 2’den büyüktür, otokorelasyon varsa negatif


0

1

: 0

: 0 ( veya 0)

H

H


0.466Ld , 1.333Ud ’e eşittir. Negatif otokorelasyon araştırıldığı için 0.466Ld ,

1.333Ud ’un dönüşümleri kullanılır.

4 2.664 3.39 4 3.534U Ld DW d için modelde otokorelasyonun varlığı

veya yokluğu hakkında bir sonuca varılamaz.

5) Aşağıdaki verilen sonuçlara göre otokorelasyonun varlığı hakkında ne

söyleyebilirsiniz?

' 4( bağımsızdeğişkensayısı) 50 1.43 0.05k n DW

Test istatistiğinin değeri 2’den küçüktür, otokorelasyon varsa pozitif


0

1

: 0

: 0 ( veya 0)

H

H


0.38Ld , 1.72Ud ’e eşittir.

0.38 1.43 1.72L Ld DW d modelde otokorelasyonun varlığı veya

yokluğu hakkında bir sonuca varılamaz.

308

6) 13.89 0.95t tY X modelinde ikinci dereceden otokorelasyonun

varlığını araştırmak amacıyla aşağıdaki yardımcı regresyon tahmin edilmiştir.

2

1 2ˆ ˆ ˆ2.07 0.97 6.3 15.1 11 0.83t t t tu X u u n R

Otokorelasyonun varlığı hakkında kararınız nedir?


0 1 2

1 1 2

: 0

: 0

H

H

Test istatistiğinin değeri: 2 11 0.83 9.13nR

0.05 anlamlılık düzeyinde tablo değeri 2 2

2 5.991c ’dir.

Test istatistiğinin hesaplanan değeri tablo değerinden büyük olduğu için 0H hipotezi

reddedilir, 1H hipotezi kabul edilir. Modelde 2. dereceden otokorelasyon vardır.


a) p=0.8 ise DW=0.5 ‘dir.

b) DW istatistiğinin değeri 2’den küçük ise pozitif otokorelasyon testi yapılır.

c) Ana kütle otokorelasyon katsayısı p ile gösterilir.

d) DW testi pozitif otokorelasyonun varlığını araştırır.

e) Sıra testi test istatistiği ki-kare dağılımına uygunluk gösterir.

8) Otokorelasyonun varlığı halinde tahmin edilen parametreler……,

parametrelerin varyansılarının tahmini……’dır.

a) En küçük değerli; en küçük değerli değil

b) Sapmasız ; sapmalı

c) Sapmalı sapmalı

d) Sapmasız; tutarsız

e) Sapmalı: sapmasız.

9) Aşağıdakilerden hangisi otokorelasyonun sembolik ifadesidir.

a) ( , ) 0i jE u u i j

b) ( , ) 0 1, ,i iE u u ı n

c) ( , ) 0i jE u u i j

d) ( , ) 0 1, ,i iE u u ı n

e) Hiçbiri

309

10) DW=2.18 ise aşağıdakilerdan hangisi doğrudur?

a) p= -0.09

b) Pozitif otokorelasyon testi yapılır.

c) Negatif otokorelasyon testi yapılır.

d) p= 1.04

e) p= 0.04

Cevaplar: 7.b), 8.b), 9.c), 10.b)

310


Bu bölümde otokorelasyon konusun ele aldık. Otokorelasyonun hata terimleri arasında

ilişki olduğu anlamına geldiğini ve genellikle zaman serisi verilerinin kullanıldığı modellerde

karşılaşılan bir sorun olduğunu belirttik. Otokorelasyon tespiti için alternatif test istatistiklerini

tanıttık ve hangi şart altında kullanılabileceklerini açıkladık ve bu testlerle ilgili uygulamalar

yaptık. Otokorelasyonun varlığı halinde kullanılacak parametre tahmin yöntemlerinin neler

olduğunu verdik.

311

Bölüm Soruları

1) Aşağıda sonuçları raporlanan regresyon modelinde;

2

1 2

2

ˆ 8.79 0.69 0.02 0.84 0.98

ˆ ˆ(2.38)(0.04) (0.005) 2,53 20

t t t

i

Y X X DW R

Se n

0tokorelasyonun varlığını araştırmak amacıyla

2

1 2 -1ˆ ˆ2,01 3,09 -12,98 5,12 0,61t tu X X u R yardımcı regresyon tahmin

edilmiştir. Buna göre aşağıdakilerden hangisi yanlıştır?

a) Birinci dereceden otokorelasyonun varlığı araştırılmaktadır.

b) Test istatistiğinin değeri 12,2 ‘ye eşittir.

c) Test istatistiği 1 serbestlik derecesi ile ki-kare dağılımına uygunluk gösterir.

d) Test istatistiğinin değeri 5.99’dır.

e) Modelde otokorelasyon yoktur.


a) Modelde kesim (otonom) parametre yoksa otokorelasyonun tespiti amacıyla Durbin-

Watson testi uygulanamaz.

b) Durbin-Watson testi ile otokorelasyon katsayısı arasında 1 2p DW ile gösterilen

ilişki vardır.

c) Durbin-Watson testi parametrik bir testtir.

d) Durbin-Watson testi ile 1t t tu u v ile gösterilen birinci dereceden otokorelasyonun

varlığını araştırılır.

e) Durbin-Watson testi otoregresif modellere uygulamaz.

3) Otokorelasyonun varlığını araştırmak için kalıntıların işareti aşağıdaki gibi

sıralanmıştır.

tu |

Yukarıdaki verilere göre aşağıdakilerden hangisi yanlıştır?

a) Birbirini takip eden işaret sayısı 7k ’ye eşittir.

b) Test istatistiği normal dağılıma uygunluk gösterir.

c) (+) îu sayısı 1 22n , (-) ˆ

iu sayısı 2 13n , 35n

d) Birbirini takip eden işaret sayısı oluşturulan güven aralığının içinde ise alternatif

hipotez kabul edilir.

e) 0 : 0H ,

1 : 0H

4) Aşağıdakilerden hangisi otokorelasyonun nedenlerinden biri değildir?

a) Hata terimlerinin birbirleriyle ilişkili olması

b) Modelin dışında bırakılan bağımsız değişken

c) Modelin fonksiyonel biçiminin yanlış belirlenmesi

d) Gecikmeli ilişkiler

e) Konjonktür ve şok etkisi

312

5) Aşağıda raporlanmış regresyon modeli tahminine göre,

2

1 1

2

ˆ 18.9 6.09 3.841 3.65 0.36

ˆ ˆ(4.08)(2.81) (1.058) 29.02 15

t t t

i

Y X Y DW R

Se n

aşağıdakilerden

hangisi doğrudur.

a) 3.65DW , 2’den büyük olduğu için DW testi ile negatif otokorelasyon testi yapılır.

b) Test istatistiği ki-kare dağılıma uygunluk gösterir.

c) Hipotez testleri 0 : 0H ,

1 : 0H

0 3: 0H ,

1 3: 0H

d) İkinci dereceden otokorelasyonun varlığı araştırılır.

e) Otokorelasyon katsayısının tahmini 0.54p ’e eşittir.

6) Aşağıdakilerden hangisi p. dereceden otokorelasyonun araştırılması ile ilgili

hipotezlerdir?

a) 0 1 2: pH , 0 1 2: pH

b) 0 1 2: 0pH p p p , 0 1 2: 0pH p p p

c) 0 : 0pH , 0 : 0pH

d) 0 1 2: 0pH , 0 1 2: 0pH

e) 0 1 2: ,pH p p p 0 1 2: pH p p p

7) Aşağıdaki verilen sonuçlara göre;

2 2

1

ˆ 12.709 0.624 15

ˆ ˆ ˆ4.91 5.87

t t

t t t

Y X n

u u u

Aşağıdakilerden hangisi yanlıştır?

a) Durbin Watson test istatistiği DW=0.84’ye eşittir.

b) Otokorelasyon katsayısının tahmini p=0.58’e eşittir.

c) Birinci dereceden otokorelasyonun varlığı araştırılmaktadır.

d) 0 : 0H p , 1 : 0 veya 0H p p

e) 0.05 anlamlılık düzeyinde 0.811Ld , 1.070Ud ’dir.

8) Otokorelasyonun varlığı halinde aşağıdaki ifadelerden hangisi doğrudur?

a) Tahmin edilen parametrelerin beklenen değeri ana kütle değerine eşit değildir.

b) Tahmin edilen parametreler en küçük varyanslı olma özelliğini devam ettirirler.

c) Hata teriminin varyansı olduğundan küçük tahmin edilmiştir.

d) Tahmin edilen prametreler etkinlik özelliklerini sürdürürler.

e) Belirginlik katsayısı etkilenmez.

313

9) Breusch-Godfey otokorelasyon testi için aşağıdaki ifadelerden hangisi

yanlıştır?

a) p. dereceden otokorelasyonun varlığını araştırmak amacıyla kullanılır.

b) Test istatistiği ki-kare dağılır.

c) Parametrik bir testtir.

d) Test istatistiğinin serbestlik derecesi tahmin edilen parametre sayısı k ‘dır.

e) Test istatistiği tablo değerinden büyük ise temel hipotez reddedilir, modelde p. dereceden

otokorelasyonun varlığı kabul edilir.


a) DW test istatistiğinin değeri 2’den büyük ise negatif otokorelasyon testi yapılır.

b) Durbin h test istatistiğinin değeri h, 2Z ’dan küçük ise negatif otokorelasyonun varlığı

söz konusudur.

c) p sıfır ise negatif otokorelasyon yoktur.

d) Sıra testi için güven aralığı aşağıdaki gibidir.

e) 2 2Prob 1.96 1.96 0.95k kE k k E k

Cevaplar

1) e

2) c

3) d

4) a

5) c

6) d

7) d

8) c

9) d

10) e

314

12. DEĞİŞEN VARYANS (HETEROSKEDASİTE)

315


12.1. Değişen Varyansın Yapısı

12.2. En Küçük Kareler Tahmincileri İçin Değişen Varyansın Sonuçları

12.3. Değişen Varyansın Tespit Edilmesi

12.4. Değişen Varyansın Varlığı Durumunda Parametre Tahmin Yöntemleri

316


1) Değişen varyans nedir?

2) Modelde değişen varyans varsa, sonuçları nedir?

3) Değişen varyansı nasıl tespit edilir?

4) Değişen varyans sorunu varsa model hangi tahmin yöntemleri ile tahmin

edilmelidir?

317




Değişen Varyansın

Yapısı

Değişen varyansı

tanımlayabilmeli Ders notları tekrar edilmeli,

Değişen Varyansın

Tespit Edilmesi Lagrange Çarpanı Testini

White Testini

Goldfeld-Quandt Testini

Spearman Sıra Korelasyon

Testini uygulayabilmek

Ders notları özümsenmeli

318

Anahtar Kavramlar

Değişen varyans

Sabit varyans

Varyans fonksiyonu

Kalıntı grafiği

Lagrange çarpanı testi

White testi

Goldfeld-Quandt Testi

Spearman Sıra Korelasyon Testi

319

Giriş

Klasik doğrusal regresyon modelinin temel varsayımlarından biri, ana kütle regresyon

fonksiyonundaki rassal hata terimlerinin (iu ) sabit varyanslı, diğer bir ifade ile her alt ana kütle

için hata teriminin varyansının eşit olmasıdır. Sabit varyans varsayımı sağlanamazsa, tahmin

edilen parametrelerin sahip olması istenen özelliklerinden hangileri gerçekleşmez?

Parametrelerin varyanslarının tahmininde ne gibi sorun çıkar? Değişen varyansın tespiti için

kullanılan testler ele alınacaktır. Bu testler sistematik ve sistematik olmayan testlerdir.

Sistematik olmayan testler kalıntı grafiklerinin incelen mesidir ki; bu yolla başarı biraz da

araştırmacının tecrübesine bağlıdır. Sistematik testler parametrik ve parametrik olmayan testler

olarak da ele alınabilir. Parametrik testler yardımcı bir regresyonun tahminini gerektirirken,

parametrik olmayan testler bir test istatistiğine dayanır, yardımcı regresyon tahmin edilmez.

320

12.1. Değişen Varyansın Yapısı

Hane halkı tüketim harcaması ile haftalık gelirin yer aldığı ana kütle için, hane halkının

haftalık tüketim için gerçekleştirdiği ortalama harcama ( )E Y , hane halkı gelirinin (X)

doğrusal bir fonksiyon olarak tanımlanmıştı.

0 1( )E Y X

Bilinmeyen ana kütle parametreler 0 ve

1 , yukarıda verilen harcama fonksiyonu

hakkında bilgi taşımaktadır. Tepki parametresi olan 1 , hane halkı geliri bir birim arttığında

hane halkının ortalama tüketim harcamasının ne kadar değişeceğini gösterir. Sabit terim 0 ,

gelir düzeyi sıfır iken gıda harcamalarını ölçer.

Xi 80 100 120 140 160 180 200 220 240 260

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

i iP Y X 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7

1/6 1/7 1/6 1/6 1/7 1/6 1/7

1/7 1/7 1/7

E Y 65 77 89 101 113 125 137 149 161 173

( )Var Y 325 462 445 707 678 750 685 1043 966 1211

0 ve 1 ’yi tahmin etmek için i=1,2,...,10 şeklinde endekslenen, i. hane halkı için

tüketim harcamasını ve gelir düzeyini gösteren (Yi, Xi) çifti ile n=10 hanelik bir örneklem

düşünelim.

Belirli bir gelir düzeyi ile bütün hane halkları aynı gıda harcamasına sahip olmayacaktır

ve regresyon modelimizin genel tanımlaması doğrultusunda iu ’yi, i. hane halkının tüketim

harcaması (Yi) ile Xi gelir düzeyinde tüm hane halkının ortalama gıda harcaması arasındaki fark

olarak gösterelim.

0 1i i i iu Y E Y Y X

Böylece i. hane halkının tüketim harcamalarını tanımlamak üzere kullanılan model

aşağıdaki şekilde yazılır.

321

0 1i iY X u

0 1( )E Y X , tüketim harcamalarının gelir düzeyiyle açıklanan bölümünü ,

iu yi

ise tüketim harcamalarının diğer faktörler tarafından açıklanan bölümünü göstermektedir.

Buraya kadar özetlediğimiz bilgi önceki derslerimizde sizlere verilmişti. Bu bölümde

0 1( )E Y X ortalama tüketim fonksiyonunun düşük gelirli hanelerin tüketim

harcamalarını yüksek gelirli hanelerin tüketim harcamalarına göre daha iyi açıklayıp

açıklayamadığını sorgulamaya başlıyoruz. Düşük gelirli hanelerin tüketim harcamaları ile

yüksek gelirli hanelerin tüketim harcamalarını tahmin etmek zorunda olsaydınız hangi tahminin

daha kolay olacağını düşünürdünüz? Düşük gelirli hane halkları tüketim için fazla seçeneğine

sahip değildir, ancak gıda, barınma gibi zorunlu tüketim harcamalarında bulunurlar ve bu tür

harcamalar için gelirlerinin büyük bir kısmını kullanırlar. Diğer taraftan, yüksek gelirli hane

halklarının tüketim harcamaları çeşitlilik arz eder. Düşük gelirli hane halkları zorunlu

harcamaları yapıyor iken yüksek gelirli aileler yılda bir iki kez tatile çıkabilir, haftanın belli

günlerinde dışarıda yemek yiyebilir, spor merkezine gidebilir. Böylece gelir değişkeni nispi

olarak yüksek gelirli hane halklarının tüketim harcamalarını açıklamak için daha az önemli bir

değişkendir. Yüksek gelirlilerin tüketim harcamalarını tahmin etmek zordur.

Tam olarak ifade ettiğimiz şeyi tanımlamanın bir başka yolu, iu ’nin büyük pozitif veya

negatif değerler alma olasılığı, yüksek gelirliler için düşük gelirlilere göre daha yüksek

olduğunu söylemektir. Hanenin geliri yüksek ise, gelir dışındaki faktörler tüketim harcamaları

üzerinde büyük bir etkiye sahip olabilir.

İktisadi bir gerçek olan yukarıdaki olgu nasıl modellenecektir? Rassal değişken iu ’nin

varyansı yüksekse, daha yüksek değerler alma olasılığına sahiptir. Bu etki, ( )iVar u yi doğrudan

X’e bağlı bir biçimde tanımlayarak tespit etmek mümkündür. Diğer bir ifade ile, X arttıkça

( )iVar Y arttığını söylemektir. X’in büyük olduğu gözlemlerde tüketim harcaması bağımlı

değişken Y’nin ortalamasından ( 0 1( )E Y X ) daha çok sapabilir. Bu durumda tüm

gözlemlerin varyansları aynı olmadığında değişen varyansın (heteroskedasitenin) varlığından

söz edebiliriz. Alternatif olarak, rassal değişken Y ve rassal hata iu değişen varyanslıdır.

Tersine eğer tüm gözlemler aynı varyansa sahip olasılık yoğunluk fonksiyonundan geliyorsa

sabit varyansın (homoskedasitenin) söz konusu olduğunu söyleyebiliriz ve Y ve iu sabit

varyanslıdır ki bu durum doğrusal regresyon modelinin temel varsayımlarındandır.

322

Şekil 12.1 Değişen varyanslı hatalar

Sabit varyans varsayımının yerine gelmediği durum değişen varyans, Şekil 12.1’de

gösterilmiştir. Değişen varyansı yukarıda verilen tüketim harcamaları ve gelir verilerinin yer

aldığı ana kütleye ait tablonun son satırından da görmeniz mümkündür. Şöyle ki; gelir arttıkça

rassal hatanın varyansı ve dolayısıyla rassal hata ile aynı varyansa sahip olan Y‘nin varyansı da

artmaktadır. Yukarıdaki şekilde iX X iken, ,i if Y X şeklindeki olasılık yoğunluk

fonksiyonu, 1Y ’in yüksek olasılıkla 1E Y ’e yaklaşacağını ifade etmektedir.

2X ’ye doğru

gidildikçe olasılık yoğunluk fonksiyonu 2 2,f Y X daha hızlı yayılacaktır. Örneğin yukarıdaki

ana kütle için 80X iken rassal hatanın varyansı 50 , 100X iken rassal hatanın varyansı 66

dır. Buna göre gelir arttıkça rassal hatanın varyansı da artmakta, dolayısıyla varsayımda durumu

değişen varyans söz konusudur.

Değişen varyansın varlığının yukarıda da ifade ettiğimiz üzere klasik doğrusal

regresyon modelinin temel varsayımlarımızdan birinin ihlalidir. Öncelikle 0 1i iY X u

modeli için iu ’nin sıfır ortalama, sabit varyanslı (σ2) ve rassal hata terimlerinin ilişkisiz

olduğunu varsayımlarını yaptığımızı hatırlayalım. Bu varsayımlar kısaca aşağıdaki gibi

gösterilmiş idi.

0iE u , 2

iVar u , , 0 içini jCov u u i j

Şimdi 2

i iVar Y Var u yi ifade eden sabit varyans varsayımı sorgulanacaktır.

Bunun için sabit varyans varsayımı aşağıdaki gibi başka bir varsayım biçimi ile değiştirilmesi

gerekmektedir.

i i iVar Y Var u h X

Burada ih X , iX arttığında iX ’nin artan bir fonksiyonudur.

Bu bölüm sabit varyans varsayımı gerçekleşmediği durum değişen varyansın

sonuçlarıyla ilgilidir. Değişen varyans durumunda EKK tahmincilerinin özellikleri açısından

323

ne tür sonuçlar ortaya çıkar? Değişen varyansın varlığını nasıl belirleyebiliriz? Daha iyi bir

tahmin tekniği var mıdır?

Değişen varyansın yapısını daha ayrıntılı bir biçimde sunabiliriz ve aynı zamanda

ortalama fonksiyonunun (0 1( )E Y X ) en küçük kareler tahmini ve ilgili en küçük kareler

kalıntılarını yeniden inceleyerek değişen varyansı belirlemek için biçimsel olmayan bir yol

sunabiliriz. Tüketim harcamaları modeli Örnek 1 gözlemleriyle tahmin edilen en küçük kareler

tahmini aşağıdaki gibidir.

ˆ 17.29 0.61i iY X

Bu tahmini fonksiyonun bir grafiği, gözlemlenen tüm harcama-gelir noktalarıyla birlikte

( ,i iY X ) aşağıdaki şekilde gösterilmiştir. Gelir ( X ) arttığında, tahmini ortalama

fonksiyonundan daha fazla sapan veri noktalarının yaygınlığı artar. X arttıkça regresyon

doğrusundan daha uzakta dağılmış noktaların sayısı artar. Bu özelliği tanımlamanın bir başka

yolu, aşağıda tanımlandığı gibi, en küçük kareler kalıntılarında gelir arttığında mutlak değer

olarak artış eğilimi söz konusu olduğunu söylemektir. ˆˆ 17.29 0.61i i iu Y X

Şekil 12.2 Tüketim harcamaları fonksiyonunun EKK tahmini ve gözlemlenen veri noktaları

(Şekil 12.2 için çeviri: yatay eksen: haftalık gelir, 100$, dikey eksen: haftalık gıda

harcaması, $)

Gözlemlenebilen EKK kalıntıları ( îu ), 0 1i i iu Y X ile verilen

gözlemlenemeyen hataların (iu ) tahmini olduğu için yukarıdaki şekil gelir arttığında

gözlemlenemeyen hataların da mutlak değer olarak artış eğilimi sergilediğini gösterir. Diğer bir

ifade ile gelir ( X ) arttığında tüketim harcamasının (Y ) ortalama tüketim harcaması ( E Y )

etrafındaki değişimi artar. Bu tespit, daha önce belirttiğimiz ortalama tüketim harcamaları

fonksiyonunun düşük gelirli hane halkları için tüketim harcamalarını açıklamada yüksek gelirli

hane halklarından daha iyi olduğunu ifade eden hipotez ile devam eder. Değişen varyans ile Y

’nin, ortalaması etrafındaki artan değişimini tespit edebiliriz.

324

Değişen varyans ile daha çok yatay kesit veri kullanıldığında karşılaşılır. Bilindiği üzere

yatay kesit veri terimi, zamanın belirli bir noktasında firma ya da hane halkları gibi ekonomik

birimlere ait veri setini ifade eder. Gelir ve tüketim harcaması için hane halkı verisi de bir yatay

kesit veri setidir. Yatay kesit veri her zaman değişen büyüklükteki ekonomik birimlerin

gözlemlerini içerir. Örneğin hane halkı verisi farklı sayıda hane halkı üyelerini ve farklı hane

halkı gelir düzeylerini içerecektir. Hane halkının daha yüksek gelir düzeyi ne kadar fazla ise

açıklayıcı değişkenler setindeki değişim ile bazı sonuç değişkenlerindeki ( Y ) değişimi

açıklamak o kadar zordur. Y değerlerinin tespit edilmesi konusunda daha yüksek gelirli hane

halklarının daha farklı ve esnek olması muhtemeldir, kısaca homojen değildir. Doğrusal

regresyon modelleri için bunun anlamı şudur: Ekonomik birimin boyutunun daha büyük olması

sonuç Y ile ilişkili daha çok belirsizliğe neden olur. Bu büyük belirsizlik, ekonomik birimin

boyutu ne kadar büyükse o kadar büyük olan bir hata varyansı belirlenerek modellenebilir.

Değişen varyans yatay kesit veri ile sınırlandırılması gereken bir özellik değildir. Bir

firma, bir hane halkı gibi ekonomik birimlerin veya tüm ekonomiye ilişkin zaman serisi verisi

ile hata varyansının değişmesi mümkündür. Eğer bir dışsal şok veya Y hakkında daha fazla ya

da daha az belirsizlik yaratacak durumlarda değişimler söz konusu ise bu doğru olacaktır.

En küçük kareler hatalarının grafikleri değişen varyansı belirlemede biçimsel olmayan

bir yoldur. İleride daha biçimsel testler dikkate alınacaktır.

12.2. En Küçük Kareler Tahmincileri İçin Değişen Varyansın

Sonuçları

Değişen varyansın varlığı 2

iVar u şeklindeki en küçük kareler varsayımının ihlal edildiği

anlamına geldiği için bu ihlal en küçük kareler tahmincimiz için ne gibi sonuçlar yaratır ve onun

için ne yapabiliriz sorusunu sormamız gerekir. Bunun iki anlamı vardır:

1. EKK tahmincisi doğrusal ve sapmasız bir tahminci olma özelliklerini korurlar, ancak

en iyi (tesirli) yani en küçük varyanslı değildir. Daha küçük varyansla başka bir tahmincinin

varlığı söz konusudur.

2. EKK tahmincileri için hesaplanan standart hatalar genellikle doğru değildir. Bu

standart hataları kullanan güven aralıkları ve hipotez testleri yanıltıcı olabilir.

Öncelikle ikinci sonucu ele alalım. Standart hatalara ne oldu?

Değişen varyans söz konusu olmaksızın basit bir doğrusal regresyon modeli aşağıdaki

gibidir.

0 1i i iY X u ve 2

iVar u

1 ’in EKK tahmincisi 1 ’in varyansını daha önce aşağıdaki gibi tanımladığımızı

hatırlayın.

325

2 2

1 2 2ˆ( )

ii

VarxX X

Yukarıdaki tanım rassal hatanın varyansının sabit ve2 ’ya eşit olduğu varsayımına

dayanmakta olup, rassal hatanın varyansının tahmincisi ise 2 2ˆ îu n k ‘dır. Şimdi her bir

gözlemin hata varyanslarının farklı olduğunu varsayalım ve bu farkı σ2’ye i simgesi ekleyerek

gösterelim, böylece;

0 1i i iY X u 2

i iVar u

Yukarıdaki değişen varyans tanımı altında en küçük kareler tahmincisi 1 ’nin varyansı


2 2 2 2

2 2 1 11 2 2

21 2

1 1

ˆ( )

n n

i i i in

i ii i

n ni

i i

i i

X X x

Var k

X X x

Burada 2 2

i i i i ik X X X X x x ’dir. Sonuç olarak eğer 2

iVar u

geçerli değil ise yukarıdaki varyans denkleminde sadeleştirmeler yapılamayacak ve sonuç

itibariyle artık

2 2

1 2 2ˆ( )

ii

VarxX X

denklemi geçerli olmayacağı için, varyansın kare kökü standart hatalar da geçerli değildir.

Minimum varyanslı doğrusal sapmasız tahmin edici olma anlamında artık en iyi

olmayan en küçük kareler tahmincisini kullanmanın ilk tanımını dikkate almak için minimum

varyans özelliğine sahip alternatif bir tahminciyi nasıl elde edeceğimizi ortaya koymaya

ihtiyacımız vardır.

12.3. Değişen Varyansın Tespit Edilmesi

Ana kütle tüketim harcamaları denkleminde iktisadi gerçekler ile de örtüşen değişen varyansa

neden olacak veri seti kullandık ve gözlemler itibariyle rassal hata varyansının değiştiğini

gördük. Ancak gerçek hayatta ana kütleyi gözlemleyemediğimiz ve örnek verilerinden ana

kütle hakkında çıkarsamalar yaptığımız için ana kütle rassal hata varyansının sabit olup

olmadığına dair belirsizlik vardır. Şunu sormak doğaldır: Eğer değişen varyans, modelim ve

veri setim için olası bir problem ise bunu nasıl anlarım? Değişen varyansı diğer tahmin

yöntemleri ile tespit etmenin bir yolu var mı? Bu soruları araştırmanın iki yolu vardır. İlki

326

kalıntı grafiklerini ele alan biçimsel olmayan yaklaşımdır. Diğeri ise biçimsel olan istatistiksel

testlerdir.

12.3.1. Sistematik olmayan test: Kalıntı Grafikleri

Değişen varyansın varlığını araştırmanın bir yolu, modeli en küçük kareler yaklaşımıyla tahmin

etmek ve en küçük kareler kalıntılarının grafiğini çizmektir. Kalıntı grafiklerinin örnekleri

Bölüm 4’de sunulan Şekil 4.7 ve 4.8’de verilmiştir. Eğer hatalar sabit varyanslı ise kalıntılarda

herhangi bir türden bir örüntü olmaz. Eğer hatalar değişen varyans içeriyorsa onlar sistematik

olarak daha büyük değişimler sergilemeye eğilimli olabilir.

Örneğin hane halkı tüketim harcamaları veri seti için gelir arttığında varyansın da

artacağından şüphelendik. En küçük karelerin kalıntılarının gelir düzeylerine karşı yukarıdaki

grafiğini çizdik. Grafikten gelir arttığında kalıntıların mutlak büyüklüğünün önemli düzeyde

arttığı açık olarak görülmektedir.

Değişen varyansı araştıran bu yönteme herhangi bir basit regresyon denklemi için

başvurulabilir. Çok değişkenli regresyonda kalıntıların sistematik olarak değişip değişmediğini

gözlemlemek için kalıntıların her bir açıklayıcı değişkene ya da îY ’ye karşı grafiği çizilerek

değişen varyansı görsel olarak tespit etmek mümkündür.

12.3.2. Sistematik Testler

12.3.2.1. Lagrange Çarpanı Testleri

Bu bölümde varyans fonksiyonuna dayalı değişen varyans için bir test ele alınacaktır. Varyans

fonksiyonu kavramına başlamak amacıyla öncelikle aşağıda verilen genel çoklu regresyon

modeli için ortalama fonksiyonunu iE Y dikkate alalım.

0 1 1 2 2i i i k ik iY X X X u

327

Şekil 12.3 En küçük kareler gıda harcamaları kalıntılarının gelir düzeyine karşı grafiği.

Varyans fonksiyonu değişen varyansın varlığında geçerli bir yaklaşımdır. Varyansı

1 2 3, , , ,i i i ikX X X X ’dan farklı olarak 1 2 3, , , ,i i i ikZ Z Z Z açıklayıcı değişkenler seti ile

ilişkilendirmemizin dışında yukarıdaki çoklu regresyon modeli için ortalama fonksiyonunu

benzerdir. Varyans fonksiyonunun genel bir biçimi aşağıdaki gibidir.

2 2

0 1 1 2 2( ) ,i i i i i k ikVar Y E u h Z Z Z

h(.) fonksiyonuna ilişkin özel bir tanımlama yapmadığımız için bu genel bir biçimdir. Varyans

fonksiyonuna göre iY ’nin varyansı Z’lere bağlı olarak her bir gözlem için değişecektir.

Örneğin tüketim harcamaları örneği için ortalama ve varyans fonksiyonları sırasıyla aşağıdaki

gibi verilmişti.

0 1( )E Y X

i i iVar Y Var u h X

Denklemlerde sadece bir tane X olduğu için bir tane Z olacaktır. Her ikisi de aynı

değişken hane halkı geliridir.

Lagrange çarpanı testinin üssel fonksiyon, doğrusal fonksiyon gibi çok sayıda .h

fonksiyon için geçerli olması, değişen varyansın tespiti için tercih nedenidir. Biz dersimizde

sadece doğrusal fonksiyonu ele alacağız.

Doğrusal varyans fonksiyonu aşağıdaki gibidir.

0 1 1 2 2 0 1 1 2 2, ,i i k ik i i k ikh Z Z Z Z Z Z

1 2 k olduğunda .h fonksiyonunun aşağıdaki şekilde daralır.

0 1 1 2 2 0,i i k ikh Z Z Z h

0h terimi bir sabittir ve 0 0h ‘dır. Buna göre varyans herhangi bir açıklayıcı

değişkene bağlı değildir. Diğer ifadeyle 1 2 0k ise değişen varyans söz konusu

değildir; varyans sabittir ve söz konusu durumu 2

0h şeklinde yazabiliriz.

Varyans fonksiyonu tanıtıldıktan sonra şimdi değişen varyansın testi için Lagrange

Çarpanı testinin uygulama aşamalarını verebiliriz.

Lagrange Çarpanı testi için temel ve alternatif hipotezler aşağıdaki gibidir.

0 1 2: 0sH

328

1 :Tüm 'ler sıfırdan farlıdır.sH

Temel ve alternatif hipotezler bir testin ilk bileşenleridir. Hipotezlerde yer alan ’lar

değişen varyansın kaynağı olduğu düşünülen değişkendir. Sonraki bileşen, bir test istatistiğidir.

Bir test istatistiğini elde edebilmek için doğrusal varyans fonksiyonunu

i i iVar Y Var u h X da yerine koyarak aşağıdaki eşitliğe ulaşılır.

2 2

0 1 1 2 2( ) ,i i i i i s isVar Y E u h Z Z Z

2 2( )i i iv u E u , bir hata karesi ( 2

iu ) ve onun ortalaması ( 2( )iE u ) arasındaki fark ile

tanımlanırsa yukarıdaki denklem, aşağıdaki biçimde yazılabilir.

2 2

0 1 1 2 2( ) ,i i i i i s is iu E u v Z Z Z v

Varyans fonksiyonuna iv ’nin eklenmesi ortalama fonksiyonuna iu ’nin ilave

edilmesiyle benzer bir amaca hizmet etmektedir. Bilindiği üzere iE Y ortalama fonksiyonuna

iu ’nin ilave edilmesiyle aşağıdaki genel regresyon modeli elde edilir:

1 0 1 1 2 2i i i i k ik iY E Y u X X X u

Ancak önemli bir farklılık vardır. Genel regresyon modelinde bağımlı değişken Y

gözlemlenebilir. Ancak, eğer 2 2

0 1 1 2 2( ) ,i i i i i s is iu E u v Z Z Z v tahmin

etmek istersek gerçek regresyon hataları ( iu ) gözlemlenemediği için bilinmediğinden dolayı

“bağımlı değişken” durumundaki 2

iu ’in de bilinmediği sonucuna rahatlıkla ulaşılabilir. Ancak

2

iu ’yi 0 1 1 2 2i i i k ik iY X X X u ’’dan elde edilen en küçük kareler kalıntılarının

kareleri ( 2îu ) ile yer değiştirerek bu problem çözülür. Böylece

2

0 1 1 2 2 ,i i i s is iu Z Z Z v

Yerine yardımcı regresyon olarak adlandırılan işlevsel biçimi aşağıdaki gibi yazılır.

2

0 1 1 2 2ˆ ,i i i s is iu Z Z Z v

Önemli not: 2

iu yerine 2îu ’yi kullanmak yeni rassal hata iv ’nin tanımını değiştirir. Bu

farklılığı göstermek için yukarıdaki denklemde esasen iv yerine *

iv yazılması gerekir. Ancak

gereksiz karışıklıklardan kaçınmak için aynı notasyon kullanılmıştır.

Değişen varyans için varyans fonksiyonu testi için, yardımcı regresyon daki en küçük

kareler tahmininden edinilen değerler kullanılır. 1 2 3, , , ,i i i isZ Z Z Z değişkenlerinin 2îu ’deki

değişimi açıklamaya yardımcı olup olmadığını belirlemeyle ilgileniyoruz. Modelin tahmini ile

elde edilen uyum iyiliği istatistiği 2R , Z’ler tarafından açıklanan 2ˆ

iu ’lerin değişim oranını

329

ölçtüğü için bir test istatistiğinin genel elemanıdır. 0H doğru ise , 2R ile gözlem sayısının

çarpımı 1s serbestlik derecesiyle Ki-kare (χ2) dağılımına sahiptir ve test istatistiği aşağıdaki

gibidir.

2 2 2

1sn R

χ2 dağılımını kullanmak için bir takım kısıtlar söz konusudur. χ2 dağılımı, çok farklı

türdeki hipotezlerin test edilmesi amacıyla kullanılan bir dağılımdır. F rassal değişkeni gibi χ2

rassal değişkeni de sadece pozitif değerler alır. Büyük bir2R değeri sıfır hipotezine karşı

kanıt sağladığı için (varyanstaki değişimlerin z değişkenleri tarafından açıklandığını varsayar)

test istatistiği için ret bölgesi dağılımın sağ kuyruğundadır. Böylece %5 anlamlılık düzeyi için

0H reddedilir ve genellikle

2 2

0.95, 1s

ise sabit varyans varsayımının geçerli olmadığı

değişen varyansın söz konusu olduğuna karar verilir. Lagrange çarpanı testi büyük örneklem

testidir.

12.3.2.2. White Testi

Lagrange çarpanı testiyle ilgili problem, eğer değişen varyansın alternatif hipotezi doğru ise

varyans fonksiyonunda bulunan değişkenler hakkında bilgi sahibi olunduğunu diğer bir ifade

ile bu değişkenlerin ( 1 2 3, , , ,i i i isZ Z Z Z ) değişen varyansın kaynağı olduğunun öngörülmesidir.

Gerçekte ise değişen varyans ilgili değişkenlere ilişkin herhangi bir bilgi olmaksızın test

edilmek istenir. Genellikle, varyansı etkileyen değişkenler ortalama fonksiyonundakilerle

aynıdır. Ortalama fonksiyonunun iki açıklayıcı değişkene sahip olduğunu varsayalım.

1 0 1 1 2 2i iE Y X X

White testinde Z ’ler X ’lere, X ’lerin karelerine ve X ’lerin olası çapraz çarpım

terimlerine eşit olarak tanımlanır. White testi çarpım terimleri olmaksızın aşağıdaki şekilde

gösterilir:

1 1Z X , 2 2Z X , 2

3 1Z X , 2

4 2Z X , 5 1 2Z X X

White testi, F testi ya da 2 2n R testi kullanılarak uygulanır. İki tane bağımsız

değişkeni olan bir model için White testinin aşamaları aşağıdaki gibidir.

Regresyon denklemi tahmin edildikten 0 1 1 2 2ˆ ˆ ˆˆ

i i iY X X sonra kalıntılar ( iu )

hesaplanır.

Yardımcı regresyon denklemi kurulur. Yardımcı regresyonun bağımlı değişkeni (

Lagrange çarpanı testinde olduğu gibi) ilk aşamada hesaplanan kalıntıların kareleri, bağımsız

değişkenleri ise yukarıda tanımlanan Z ’dir. Buna göre yardımcı regresyon aşağıdaki gibi

tanımlanır.

330

2

0 1 1 2 2 3 3 4 4 5 5ˆ

i i i i i i iu Z Z Z Z Z v

Yardımcı regresyonun belirginlik katsayısı (R2) hesaplanır ve temel ve alternatif

hipotezler kurulur.

0 1 2 3 4 5: 0H

1 1 2 3 4 5: 0H

Temel ve alternatif hipotezde yer alan parametrelerin Z’lerin katsayısı olduğuna sabit

parametrenin hipotezler dâhil edilmediğine dikkat edin.

0H doğru ise , 2R ile gözlem sayısının çarpımı yardımcı regresyondaki bağımsız

değişken sayısı k (burada k=4) serbestlik derecesiyle Ki-kare (χ2) dağılımına sahiptir ve test

istatistiği aşağıdaki gibidir.

2 2 2

kn R

değeri hesaplanır. Gözlem sayısı hem ana modelde hem de yardımcı regresyon modelinde

aynıdır.

2 ve 2

k ile mukayese edilir. 2 2

k ise sabit varyans varsayımını ifade eden 0H

temel hipotezi reddedilir. Modelin hata teriminin varyansı gözlemler itibariyle değişmektedir.

Açıklayıcı Örnek: Tüketim Harcamaları Modeli

White testinin uygulaması için tüketim harcamaları örnek 1’in verileri kullanılacaktır.

Hatırlanacağı üzere Örnek 2 verilerinden örnek regresyon fonksiyonu ˆ 9.37 0.65i iY X

olarak elde edilmişdi. Varyansın potansiyel olarak gelirin bir fonksiyonu olduğu tüketim

harcamasının bu örneğinde değişen varyansı test etmek için 2

0 1i ih X şeklindeki

varyans fonksiyonunda 0 1: 0H hipotezini alternatifi olan 1 1: 0H hipotezine karşı test

ederiz.

ˆ 9.37 0.65i iY X modeli için belirginlik katsayısı 2 0.90R , n=10 olduğuna göre

test istatistiği

2 2 10 0.90 9n R

Sıfır hipotezinde sadece bir parametre olduğu için χ2 testinin serbestlik derecesi birdir.

%5 kritik değeri 3.84’tür. 9,;3.84’ten daha büyük olduğu için H0 hipotezini reddederiz ve

varyansın gelire bağlı değiştiğini kabul ederiz.

White testinin uygulamasına yardımcı regresyon 2 2

0 1 2ˆ

i i iu X X fonksiyonunu

EKK yaklaşımı ile tahmin ederek başlarız ve 0 1 2: 0H hipotezini

331

1 1 2: 0 veya 0H hipotezine karşı test ederiz. Yardımcı regresyon aşağıdaki gibi tahmin

edilmiştir.

2 2ˆ 1038.16 15.95 0.057i i iu X X 2 0.85R

Buradan test istatistiği

2 2 10 0.85 8.5n R

olarak hesaplanır. %5 kritik değer 2

0.95,25.99 ’dir. Tekrar, gelire bağlı değişen varyansın

söz konusu olduğu sonucuna ulaştık.

12.3.2.3. Goldfeld-Quandt Testi

Goldfeld-Quandt testi büyük örneklere uygulanan F-testidir. Goldfeld-Quandt testi, olası farklı

varyanslı iki grup veri için tasarlanmıştır. Bu durumu tanıtmak için, ücretliler için tüketim

fonksiyonu ile serbest meslek sahiplerinin tüketim modelinin farklılaştığı iktisadi gerçeklere

uygundur. Serbest meslek sahipleri genel olarak ücretlilere göre daha fazla gelir elde ettikleri

için tüketimleri ücretlilere göre farklılık arz eder. Ücretliler ve serbest meslek sahiplerini tek

bir grup olarak düşünür ve ortalama tüketim denklemini elde etmek istersek, tüketim

kalıplarının farklılığından dolayı değişen varyans problemi ile karşılaşmamız kaçınılmazdır.

Sorduğumuz soru: ücretlilerin tüketim varyansı ile karşılaştırıldığında serbest meslek

sahiplerinin tüketim varyansı ne kadardır? Varyanslar aynı ya da farklı mıdır? Ücretlilerin

tüketim ve serbest meslek sahiplerinin tüketim varyansı yukarıdaki nedenden dolayı tüm

gözlemler için sabit değildir. Goldfeld-Quandt testi değişen varyansın örneklemin iki gruba

bölünebildiği –bu durumda ücretliler ve serbest meslek- biçimini test etmek amacıyla

tasarlanmıştır ve varyansın iki grup için farklı olabileceğinden şüpheleniriz.

Test, her bir gruptan tahmin edilen hata varyanslarının karşılaştırılmasına

dayanmaktadır. Goldfeld-Quandt testi, rassal hataların normal dağıldığı ve birbirleri ile ilişkisiz

oldukları (otokorelasyon olmadığı) varsayımına dayanmaktadır.

Testin uygulamasının ilk aşamasında X bağımsız değişkeni küçükten büyüğe ilgili Y

bağımlı değişkeni ile sıralanır. Sıralanan gözlemlerin ortasından c sayıda gözlem çıkarılır.

Geriye kalan n-c sayıdaki gözlem ikiye ayrılır 2n c . Bu durumda ilk grupta küçük değerli

X’ler, ikinci grupta ise daha büyük değerli X’ler yer alacaktır. Amaç bu iki grubun

varyanslarının eşit olup olamadığını tespit etmektir. Eğer eşit değilse X’lerin değeri artarken

rassal hatanın da varyansının arttığı sonucunu çıkarırız. Burada önemli iki önemli husus vardır.

Bunlardan ilki dışlanan gözlem sayısı c’nin kaç olacağıdır. Monte Carlo denemelerine göre

n=30 iken c=4, n=60 iken c=10 alınmasının yeterli olduğu konusunda bir görüş vardır. İkincisi

ise çok değişkenli regresyon modelinde sıralama işleminin hangi X değişkenine göre

yapılacağıdır. Şayet hangi bağımsız değişkenin değişen varsa sebep olabileceği öngörüle

biliniyorsa sıralama o değişkene göre yapılır, aksi takdirde her değişken için test tekrarlanır.

332

İki alt gruptan küçük X değerlerinin bulunduğu gözlemler için rassal hatanın varyansı2 2( )K iKVar u ile, büyük X değerlerinin bulunduğu gözlemler için rassal hatanın varyansı

2 2( )B iBVar u ile gösterilsin.

2 2( )K iKVar u ve

2 2( )B iBVar u eşitliklerinin söz konusu olduğu şeklindeki 2 2

K B

sıfır hipotezini test etmek istiyoruz. Test istatistiği aşağıdaki gibidir.

2 2

,2 2

ˆ

ˆ B k

B B

n k n k

K K

F F

Burada ( )Bn k ve ( )Kn k , iki alt örneklemli regresyonlar için serbestlik dereceleridir ve

B Kn n eşitliği geçerlidir. Diğer bir deyişle bir varyans tahmininin onun gerçek ana kitle değeri

oranına eşit bir paya ve diğer varyans tahmininin onun ana kitle değeri oranına eşit bir paydaya

sahip olan F istatistiği, ( , )B Kn k n k şeklindeki serbestlik derecesi ile bir F dağılımına

sahiptir.

Aşağıdaki hipotezleri test etmek istediğimizi varsayalım:

2 2

0 : B KH

2 2

1 : B KH

H0 doğru ise yukarıdaki test istatistiği aşağıdaki gibi olur.

2

2

ˆ

ˆB

K

F

Denklemde yer alan rassal hataların varyanslarının 2 2ˆ ˆîu n k ile tahmin edildiğini

hatırlayın. Hesaplanan test istatistiği verilen bir anlamlılık düzeyinde ( , )B Kn k n k

şeklindeki serbestlik dereceli cF değerinden büyükse değişen varyans olduğu sonucuna varılır.

Açıklayıcı Örnek: Tüketim Harcamaları Modeli

İkinci bölümde verilen ana kütleden rastlantısal 30 aile çekilmiş ve aşağıdaki örnek

regresyon fonksiyonu elde edilmiştir.

2 ˆ9.29 0.64 30 0.95 9.18

ˆ( ) (5.231)(0.638)

i

i

Y X n R

Se

333

Yukarıdaki tüketim modelinde değişen varyansın varlığını Goldfeld-Quandt testi araştıralım.

Gözlem ler Y (Tüketim) X

(Gelir)

Sıralı Y Sıralı X

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

55

65

70

80

79

84

98

95

90

75

74

110

113

125

108

115

140

120

145

130

152

144

175

80

100

85

110

120

115

130

140

125

90

105

160

150

165

145

180

225

200

240

185

220

210

245

55

70

75

65

74

80

84

79

90

98

95

108

113

110

125

115

130

135

120

140

144

152

140

80

85

90

100

105

110

115

120

125

130

140

145

150

160

165

180

185

190

200

205

210

220

225

334

24

25

26

27

28

29

30

180

135

140

178

191

137

189

260

190

205

265

270

230

250

137

145

175

189

180

178

191

230

240

245

250

260

265

270

Yukarıdaki tablonun 4. ve 5. Sütunları Goldfeld-Quandt testinin birinci aşamasıdır. X

değerleri küçükten büyüğe doğru ilgili Y değerleri ile birlikte sıralanmıştır. n=30 olduğuna göre

ortadan c=4 gözlem analiz dışı bırakılacaktır. Bunlar 14.,15., 16. ve 17. gözlemlere ilişkin

verilerdir. Böylece verimiz aşağıdaki gibi iki alt örnekleme ayrılmıştır.

1.Alt Örneklem

(Küçük X’ler için)

2.Alt Örneklem

(Büyük X’ler için)

Gözlemler Sıralı Y Sıralı X Gözlemler Sıralı Y Sıralı X

1

2

3

4

5

6

7

8

9

10

11

55

70

75

65

74

80

84

79

90

98

95

80

85

90

100

105

110

115

120

125

130

140

18

19

20

21

22

23

24

25

26

27

28

135

120

140

144

152

140

137

145

175

189

180

190

200

205

210

220

225

230

240

245

250

260

335

12

13

108

113

145

150

29

30

178

191

265

270

Yukarıdaki iki alt örneklem için örnek regresyon fonksiyonu tahmin edilir. Not: Basit

regresyon modelinin tahmin edilmesini ve model ile ilgili aşağıdaki unsurların nasıl

hesaplandığını biliyor olmanız gerekmektedir. Tahmin sonuçları aşağıda raporlanmıştır.

1.Alt Örnek

2 2

1 1 1 1ˆ ˆ3.409 0.67 13 0.89 5.86 377.17

ˆ( ) (0.074)(8.70)

i i i

i

Y X n R u

Se

2. Alt Örnek

2 2

2 2 2 2ˆ ˆ28.03 0.79 13 0.77 11.82 1536.8

ˆ( ) (30.62)(0.132)

i i

i

Y X n R u

Se

Goldfeld-Quandt testi için temel va alternatif hipotezler aşağıda verilmiştir.

2 2

0 1 2:H

2 2

1 1 2:H

1.Alt Örnek için rassal hataların varyansının tahmini aşağıdaki gibidir. (Gözlem sayısı

n1 =13, Tahmin edilen paramatre sayısı k=2

2

12

1

1

ˆ 377.17 377.17ˆ

1334.2

2 119

iu

n k

2.Alt Örnek için rassal hataların varyansının tahmini aşağıdaki gibidir. (Gözlem sayısı

n2=13, Tahmin edilen paramatre sayısı k=2

2

22

2

2

ˆ 1536.8 1536.8ˆ 139.71

13 2 11

iu

n k

değerlerini elde ederek aşağıdaki F istatistiğini hesaplarız.

2

2

2

1

ˆ 139.714.07

ˆ 34.29F

336

Varyansların artabileceğini ancak gelirle azalmayacağını düşünerek %5 anlamlılık

düzeyinde kritik değeri 0.95,11,11

2.82F olan bir tek kuyruk testi kullanırız. 4.07>2.82 olduğu

için sabit varyansı ifade eden sıfır hipotezi varyansların gelirle birlikte artacağını ifade eden

alternatif hipotez lehine reddedilir.

12.3.2.4. Spearman Sıra Korelasyon Testi

Yukarıda tanıtılan 3 test de test istatistiklerinin hesaplanması yardımcı regresyonların tahmin

edilmesi ile mümkün olduğu için parametrik testlerdir. Değişen varyansın tespitine yönelik

tanıtılacak test, parametrik olmayan bir testdir ve bu yönüyle ilk üç testden ayrılmaktadır.

Öncelikle istatistikte kullanılan Sıra korelasyon testinin ne olduğuna kısaca değinelim. X ve Y

değerleri arasındaki korelasyonu hesaplamak yerine, 2 serideki kıymetler büyükten küçüğe ya

da küçükten büyüğe numaralandırılarak, bu sıra numaraları arasındaki ilişki araştırılırsa buna

sıra korelasyon testi adı verilmektedir. Ekonometride değişen varyansın tespiti için bu testin

uygulamasında kalıntı ile X bağımsız değişkenine sıra numarası verilir.

Spearman sıra korelasyon testinin uygulaması aşağıdaki gibidir.

Öncelikle değişen varyansın varlığının araştırıldığı tahmin edilmiş regresyon

denkleminden kalıntılar elde edilir. Kalıntıların işareti dikkate alınmadan (mutlak değerleri ile)

büyükten küçüğe ya da küçükten büyüğe sıralanır. Aynı işlem X bağımsız değişkeni için de

yapılır. Her iki sıra numarası arasındaki fark (d) hesaplanır. Daha sonra kalıntıların sıra

kıymetlerı ile X değişkenin sıra kıymetleri arasındaki ilişkiyi gösteren aşağıdaki Spearman sıra

korelasyon katsayısı hesaplanır.

2

21 6

1

i

s

dr

n n

Buradaki i i id X u= - şeklinde hesaplanır ve sıralama kıymetleri arasındaki farkı ifade eder.

n gözlem sayısıdır. Anakütle korelasyon katsayısının 0’a eşit ve gözlem sayısının 8’den

büyük olduğu varsayımına göre, spearman sıra korelasyon testi n-2 serbestlik derecesi ile t –

dağılımına uygunluk göstermektedir ve test istatistiği aşağıdaki gibidir.

22

2

1

s

n

s

r nt t

r

Test istatistiğinin hesaplanan değeri verilen anlamlılık düzeyinde 2n

t

değerinden

büyükse değişen varyansın varlığı kabul edilir.

Açıklayıcı Örnek: Tüketim Modeli

1982-1995 yılları arasındaki Gelir (Y) ve Tüketim (C) verilerinden tahmin edilen

regresyon fonksiyonu aşağıda raporlanmıştır. Değişen varyansın varlığını Spearman Sıra

korelasyon testi ile araştıralım.

337

2 ˆ1796.09 0.69 14 0.92 328.78

ˆ( ) (596.84)(0.056)

i i

i

C Y n R

Se

Modelin verileri ve kalıntılar aşağıdaki gibidir.

Yıllar Tüketim (C ) Gelir (Y) îu

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

6702

6812

7399

8095

8935

9447

9369

9097

8788

8843

9189

9585

9957

10409

7357

7752

8325

8987

9699

10076

10365

10323

10213

10637

11126

11485

12051

12693

-177.21

-340.13

-149.02

89.56

437.64

689.16

411.48

168.5

-64.49

-302.44

-294.3

-146.34

-165.41

-156.98

Spearman sıra korelasyon testi uygulamasının ilk aşaması kalıntılar ve bağımsız

değişkenlere küçükten büyüğe veya büyükten küçüğe sıra numarası vermektir. Biz

uygulamamızda küçükten büyüğe sıra numarası vereceğiz. Okuyucu isterse büyükten küçüğe

sıra numarası vererek aynı sonuca ulaşabilir.

Gelir (Y) sıra no îu sıra no id 2

id

338

1

2

3

4

5

6

9

8

7

10

11

12

13

14

8

11

4

2

13

14

12

7

1

10

9

3

6

5

-7

-9

-1

2

-8

-8

-3

1

6

0

2

9

7

9

49

81

1

4

64

64

9

1

36

0

4

81

49

81

0id 2 524id

Not: 0id olmalıdır.

Spearman sıra korelasyon katsayısı

2

2 2

5241 6 1 6 0.1516

1 14 14 1

i

s

dr

n n

olarak hesaplanır. Spearman sıra korelasyon katsayısı test istatistiğinin değeri:

2 2

0.1516 14 220.5312

1 1 0.1516

s

s

r nt

r

339

0.5312t değeri 0.05,14 2 0.05,12

2.179ct t t

ile karşılaştırıldığında

0.5312 2.179ct t olduğu için tüketim modeli için sabit varyans varsayımının geçerli

olduğu sonucuna varılır.

12.4. Değişen Varyansın Varlığı Durumunda Parametre Tahmin

Yöntemleri

Hata terimleri değişen varyanslı olduğunda en küçük kareler tahmincisi en iyi doğrusal

sapmasız tahminci değildir. Değişen varyansın varlığı durumunda model

Genelleştirilmiş En Küçük Kareler

Ağırlıklı En Küçük Kareler

yöntemleri ile tahmin edilir. Burada tahmin yöntemlerinin neler olduğu verilmekle

yetinilecektir. Bu konu hakkında daha fazla okuma yapmak isteyenler, Temel Ekonometri

kitaplarından yararlanabilir.

340

Uygulamalar

341

Uygulama Soruları

1-4 arası sorular aşağıda raporlanmış sonuçlara göre cevaplandırılacaktır.

2

1 2ˆ 0.61 19.23 0.36 0.69 21

ˆ( )(0.05) (3.52) (0.035)i

Y X X R n

Se

Modelinde değişen varyansın varlığını araştırmak için aşağıdaki yardımcı regresyon

modeli tahmin edilmiştir. ( tahmin edilen modelin parametrelerini, yardımcı

regresyonun parametrelerini ifade etmek üzere)

2 2

2ˆ 1.45 3.78 0.84

ˆ( )(0.35) (1.075)

i

i

u X R

Se

1) Değişen varyansın testi için temel ve alternatif aşağıdakilerden hangisidir?

a) 0 0 1: 0H ,

1 0 1: 0H

b) 0 1 2: 0H ,

1 1 2: 0H

c) 0 2: 0H ,

1 2: 0H

d) 0 1: 0H ,

1 1: 0H

e) 0 0 1 2: 0H ,

1 0 1 2: 0H

2) Test istatistiğinin değeri nedir? ( 0.05 )

a) 14.49

b) 17.64

c) 1.68

d) 1.38

e) 32.84

3) Test istatistiği hangi dağılıma uyar, test istatistiğinin değeri nedir?

a) Ki-kare2

2 5.991

b) Ki-kare, 2

1 3.841

c) Ki-kare2

3 7.815

d) t-, 21 2

2.093t

e) t-, 21

1.721t

4) Karar için aşağıdakilerden hangisi doğrudur?

a) 17.64 > 3.841 değişen varyansın varlığı kabul edilir.

b) 14.49 >7.815 değişen varyansın varlığı kabul edilir.

c) 1.68 <5.991 sabit varyans kabul edilir.

d) 1.38<2.093 sabit varyans kabul edilir.

e) 32.84>1.721 değişen varyans kabul edilir.

5) Spearman sıra korelasyon testi ile

Gözlem 1 2 3 4 5 6 7

342

ˆtu -0.92 1.83 -3.61 2.06 0.11 -0.43 1.91

X 2 6 4 5 11 9 1

Y 4.6 0.8 11 7.64 5.12 3.92 6.54

değişen varyansın araştırılması için aşağıdaki sıralamalardan hangisi doğrudur?

a)

ˆtu 6 3 7 1 4 5 2

X 6 3 5 4 1 2 7

b)

ˆtu 5 4 1 2 7 6 3

X 6 3 5 4 1 2 7

c)

ˆtu 6 3 7 1 4 5 2

Y 5 7 1 2 4 6 3

d)

ˆtu 5 4 1 2 7 6 3

Y 5 7 1 2 4 6 3

e)

ˆtu 6 3 7 1 4 5 2

X 6 3 5 4 1 2 7

6) 40 gözleme ait verilerden aşağıdaki regresyon modeli tahmin edilmiştir.

2

1 2 3ˆ 12.94 0.47 3.96 0.03 0.69 40

ˆ( )(3.41) (0.12) (0.035) (0.015)i

Y X X X R n

Se

3X değişkeninin değişen varyansa sebep olduğunun testi amacıyla aşağıdaki modeller tahmin

edilmiştir.

2 2

1 2 3

2 2

1 2 3

ˆ ˆ1.04 120.7 13.6 4.13 24.7 0.69 15

ˆ ˆ21.94 2.71 0.87 2.07 3.81 0.53 15

B

K

Y X X X R n

Y X X X R n


a) Ortadan atılan gözlem sayısı 8’dir.

b) Test istatistiğinin değeri 6.48 olarak hesaplanmıştır.

c) 0.05 anlamlılık seviyesinde F tablo değeri 2.69’a eşittir.

d) Değişkenler 3X Bağımsız değişkeninin değerine göre küçükten büyüğe doğru

sıralanmışlardır.

e) Modelde sabit varyans vardır.

7) Aşağıdaki ara sonuçlara göre spearman sıra korelasyon katsayısının değeri

nedir?

2 2 2ˆ178 12 0.04 0.91id n R

a) 0.38

343

b) 1.20

c) -0.38

d) 0.61

e) -0.02

8) Aşağıda tahmin edilen regresyon modelinde 2

1ˆ 1.24 0.93 1.94 0.98 29 1.96

ˆ( ) (0.02) (0.13) (0.84)

t t t

i

Y X Y R n DW

Se

Değişen varyansın tespiti amacıyla aşağıdaki regresyon modeli tahmin edilmiştir.

2 2 2

1 1 1ˆ 4.91 2.31 0.271 1.12 0.07 0.27 0.13t t t t t t tu X X Y Y X Y R

Aşağıdaki ifadelerden hangisi yanlıştır?

a) 0 1 2 3 4 5: 0H

0 1 2 3 4 5: 0H

b) Test istatistiğinin değeri 3.77’dir.

c) Tablo değeri 2

0.95,511.070 ’dir

d) Temel hipotez kabul edilir, değişen varyans sorunu yoktur.

e)

2 2

0.95,53.77 11.070

9) Aşağıdakilerden hangisi değişen varyansın tespiti için kullanılan parametrik

olmayan bir testtir.

a) White testi

b) Lagrange çarpanı testi

c) Spearman sıra korelasyon testi

d) Goldfeld-Quandt testi

10) Değişen varyansın tespiti için X’in küçük değerlerinin yer aldığı 15 gözlemlik

regresyon modeline ilişkin ara sonuçlar aşağıdaki gibidir. 2 27153,667 10123.33 5498.933xy x y

X’in büyük değerlerinin yer aldığı 15 gözlemlik regresyon modeline ilişkin ara

sonuçlar aşağıdaki gibidir.

2 29280 12250 8665.6xy x y

Değişen varyansın varlığını test edin.

Bu uygulamada X ilgili bağımsız değişkeni ile küçükten büyüğe sıralanmış ve Küçük X

değeri için bir regresyon, büyük X değerleri için ikinci bir regresyon tahmin edildiği verilerden

anlaşılmaktadır. Buna göre uygulanan test Goldfeld-Quandt testi olup, bu test iki alt

regresyonun hata terimilerinin eşitliğinin testine dayanmaktadır. Öyleyse temel ve alternatif

hipotezler aşağıdaki gibidir.

344

2 2

0

2 2

1

:

:

B K

B K

H

H

Test istatistiği ise;

2

,2 b k

B

n k n k

K

F F

Ancak dikkat edilirse alt regresyonlara ait hata terimlerinin varyanslarının tahminler

verilmemiş, sizin hesaplamanız istenmiştir. Şimdi önceki derslerimizde öğrendiğimiz bilgiler

ile hata terimlerinin varyanslarını tahmin edelim.

2

2ˆ

ˆK

K

k

u

n k

bunun için 2 2 2ˆ ˆy y u eşitliğinden öncelikle 2ˆ

Bu hesaplanması gerekir

.Yukarıdaki verilerde toplam değişme 2 5498.933y olarak verilmiş, regresyon ile

açıklanan değişmenin hesaplanabilmesi için ara sonuçlar verilmiştir 2 2 2

1ˆˆ

iy x ) buna

göre aşağıdaki işlemler sırasıyla uygulanır.

1 2

7153,667ˆ 0.7110123.33

xy

x

2 2 2 2

1ˆˆ (0.71) 10123.33 5055.15iy x buradan

2 2 2ˆ ˆ 5498.933 5055. 443.7815 3Ku y y

Ve küçük X değerlerinin yer aldığı alt regresyonun hata teriminin varyansı aşağıdaki gibi

tahmin edilir.

2

2 443.783ˆˆ

1534.13715

2

K

K

k

u

n k

Aynı şekilde büyük X’lerin değerlerinin yer aldığı alt regresyonun hata teriminin varyansının

tahmini için;

1 2

9280ˆ 0.7612250

xy

x

2 2 2 2

1ˆˆ (0.76) 1225 7075.60iy x

2 2 2ˆ ˆ 8665.6 7075.6 1590Bu y y

2

2 1590122.

ˆ

23

51ˆ

1

B

B

B

u

n k

345

Goldfeld-Quandt testinin istatistiği aşağıdaki gibi hesaplanır.

2

2

122.31

34.137153.58B

K

F

Tablo değeri

0.95;13,132.57F

Karar

0.95;13,133.58 2.57F F alternatif hipotez kabul edilir, X’in değeri arttıkça hata teriminin

de değeri artmaktadır.

Cevaplar

1.d), 2.b), 3.b), 4.a), 5.b), 6.e), 7.a), 8.a), 9.c), 10. çözümlendi

346


Bu bölümde değişen varyans kavramını ve değişen varyansın varlığı halinde tahmin

edilen parametreler, parametrelerin varyansları, hipotez testleri ve güven aralıkları üzerindeki

etkilerini öğrendik. Değişen varyansın tespitine yönelik parametrik ve parametrik olmayan

testler verilmiştir. Bu testlerden lagrange çarpanı, White testi ve Goldfeld-Quandt testi değişen

varyansın tespiti için yeni regresyon modellerinin tahmin edilmesini gerektirdiğinden

parametrik testlerdir. Spearman sıra korelasyon testi ise parametrik olmayan testlerdir. Ayrıca

değişen varyans durumunda EKK yerine genelleştirilmiş EKK ve ağırlıklı EKK yöntemlerinin

kullanılması gerektiği belirtilmiştir.

347

Bölüm Soruları


a) Değişen varyans ana kütle ile ilgili bir sorundur.

b) Değişen varyans sorunu genellikle zaman serilerinin kullanıldığı modellerde

karşılaşılır.

c) Y’in değeri artarkan hata teriminin varyansı da artıyorsa değişen varyans sorunu

vardır.

d) Değişen varyansın sembolik ifadesi: 2 2

i iE u E u

e) Gözlem sayısı az ise değişen varyans problemi ile karşılabiliriz.

2) Değişen varyansın varlığı halinde EKK tahmincisi ……. ve ……. bir tahminci

olma özelliklerini korurlar. ancak en iyi (tesirli) yani en küçük varyanslı değildir.

Daha küçük varyansla başka bir tahmincinin varlığı söz konusudur.

a) En küçük varyanslı - sapmasız

b) Doğrusal- sapmasız

c) Doğrusal – en küçük varyanslı

d) Tutarsız- doğrusal

e) Sapmasız – tutarsız

3) Değişen varyansın varlığı halinde EKK tahmincisi hesaplanan standart hatalar

doğru değildir. Bu nedenle güven aralıkları ve hipotez testleri yanıltıcı olabilir.

a) Belirginlik katsayısı- düzeltilmiş belirginlik katsayısı

b) hata teriminin varyansı- güven aralıkları

c) hata teriminin varyansı – hipotez testleri

d) serbestlik derecesi- güven aralıkları

e) güven aralıkları - hipotez testleri

4) Aşağıda verilen tabloya göre;

X 5 7 9 11 13 15 17

( )iVar u 0.78 0.87 1.01 1.52 1.69 2.03 3.02

Değişen varyans hakkında ne söyleyebilirsiniz?

a) Sabit varyans varsayımı geçerlidir.

b) Koşullu olasılıklar sabit ise değişen varyans vardır.

c) Yukarıdaki veriler değişen varyans için bir sonuca varmada yeterli değildir.

d) X’in değeri arttıkça hata teriminin varyansı azalmaktadır.

e) X’in değeri arttıkça hata teriminin varyansı da artmaktadır.

348


a) Değişen varyansın varlığı halinde EKK tahmincilerinin varyans formülleri geçerli

değildir.

b) Değişen varyansın varlığı halinde EKK tahmincilerinin standart hataları

geçersizdir.

c) Değişen varyansın varlığı halinde EKK tahmincileri en küçük varyanslı değildir.

d) Değişen varyansın varlığı halinde başka tahmin yönteminden de küçük varyanslı

tahminler elde edilemez.

e) Değişen varyansın varlığı halinde EKK tahmincileri etkin değildir.

6) Aşağıda verilen tabloya göre;

X 20 30 40 50 60 70 80

( )iVar Y 14.2 12.5 9.5 6.2 5.01 4.02 3.99

Aşağıdakilerden hangisi yanlıştır?

a) Yukarıdaki veriler bağımlı değişkenin varyanslarıdır.

b) Yukarıdaki veriler rassal hata teriminin varyanslarıdır.

c) X’in değeri arttıkça bağımlı değişkenin varyansı küçülür.

d) X’in değeri arttıkça rassal hatanın varyansı küçülür.

e) Hata teriminin varyansı tahmin edilen parametrenin değerine göre küçülür.

7. Aşağıdaki verilere göre modelde değişen varyansın tespiti için spearman sıra

korelasyon testi uygulanmıştır.

Gözlem 1 2 3 4 5 6 7 8 9

Y 2 3 4 6 10 20 19 15 22

X 1 5 4 10 9 8 12 17 14

îu -0.38 -0.85 0.52 0.33 0.68 -0.3 -1.07 0.22 -1.71

0.05 anlamlılık seviyesinde Aşağıdakilerden hangisi yanlıştır.

a) 2 114id

b) 5id

c) Spearman sıra korelasyon katsayısının değeri 0.05’dir.

d) Test istatistiğinin değeri 2.65’dir.

e) 2.65> tc= 2.365 olduğu için değişen varyansın varlığı kabul edilir.

8. 1970-1983 arası yıllık veriler kullanılarak GSYİH ve para arzı arasındaki

ilişki aşağıdaki gibi tahmin edilmiştir. 2ˆ 158.78 1.203 2 0.9943

ˆ( ) (43.04) (0.026)i

GSMH M r

Se

Değişen varyansın tespiti amacıyla aşağıdaki yardımcı regresyon tahmin edilmiştir. 2 2 2ˆ 1347.718 3.654 2 0.0027 2 0.675

ˆ( ) (5367.136)(7.1934) (0.0021)i

u M M R

Se


349

a) 0 0 1 2: 0H ,

0 0 1 2: 0H

b) White testi uygulanmaktadır.

c) Test istatistiğinin değeri 9.45’e eşittir.

d) Tablo değeri 2

0.95,25.99

e)

2 2

0.95,29.45 5.99 değişen varyansın varlığı kabul edilir.

9. Goldfeld-Quandt testinin temel ve alternatif hipotezleri ile test istatistiği

aşağıdakilerden hangisidir?

a) 2 2 2 2 2 2

0 1: ; : ;B K B K B KH H F

b) 2 2 2 2 2 2

0 1: ; : ;B K B K B KH H t

c) 2 2 2 2 2 2 2

0 1: ; : ;B K B K B KH H

d) 2 2 2 2 2 2

0 1: ; : ;B K B K B KH H t

e) 2 2 2 2 2 2

0 1: ; : ;B K B K B KH H F

10. 2ˆ 37.21 8B Bu n ve 2ˆ 78.06 8K Ku n ise Goldfeld-Quandt testinin test

istatistiğinin değeri aşağıdakilerden hangisidir?

a) 0.48

b) 2.10

c) 5.92

d) 1.93

e) 0.71

Cevaplar

1) a

2) b

3) e

4) e

5) d

6) e

7) e

350

8) b

9) a

10) a

351

13. ÇOKLU DOĞRUSAL BAĞLANTI

352


13.1. Çoklu Doğrusal Bağlantı Sebepleri

13.2. Çoklu Doğrusal Bağlantının Dereceleri

13.3. Çoklu Doğrusal Bağlantının Sonuçları

13.4. Çoklu Doğrusal Bağlantının Tespiti

353


1) Çoklu doğrusal bağlantı ne demektir?

2) Çoklu doğrusal bağlantı ne gibi problemlere yol açmaktadır?

3) Çoklu doğrusal bağlantı nasıl tespit edilir?

4) Çoklu doğrusal bağlantı durumunda ne yapılmalıdır?

354




Çoklu Doğrusal

Bağlantı Sebepleri

Çoklu doğrusal bağlantının ne

anlama geldiğini ve tam çoklu

doğrusal bağlantının varlığı

halınde EKK tahmincilerinin

özelliklerini kavramak

Ders notları

Çoklu Doğrusal

Bağlantının Tespiti

VIF katsayısının

hesaplanabilmesi

Ders notları, uygulamaları tekrar

etmeli

355

Anahtar Kavramlar

Tam çoklu doğrusal bağlantı,

Varyans büyütme faktörü (VİF)

356

Giriş

Klasik doğrusal regresyon modellinde yer alan 2 ve ya daha fazla bağımsız değişkenin

doğrusal bağlantılı olmadığı varsayılmıştır. Bundan bir sapma olduğunda diğer bir ifade ile

bağımsız değişkenler arasında doğrusal bir bağlantının varlığı çoklu doğrusal bağlantı

problemini göstermektedir. Çoklu doğrusal bağlantı 2 değişken arasında olabileceği gibi 3, 4

ve ya daha fazla değişken arasında olabilir. Çünkü iktisadi değişkenler hep aynı şeylerden

etkilenmektedir.

0 1 1 2 2 .......i k kY X X X u

Böyle bir modelde tam çoklu doğrusal bağlantı olma koşulu;

0 0 1 1 2 2 ....... 0k kX X X ile mümkündür. 0’dan k’ya kadar olan değişkenleri öyle

sayılarla çarpalım ve toplayalım ki toplam 0 olsun. Bu şart gerçekleşiyorsa modelde tam çoklu

doğrusal bağlantı vardır. (0 1 2 ....... 0k )

0 1 1 2 2i i i iY X X u modelinde kullanılan bağımsız değişkenlerin değerleri aşağıda

verilmiştir.

X1 X2

10 50

15 75

18 90

24 120

30 150

1 10 50

1 15 75

1 18 90

1 24 120

1 30 150

X

1ˆ ( ' ) 'X X X Y

357

Anlaşılacağı gibi değişkenler arasında bir ilişki söz konusudur.

2 1

2 15

X X

X X

Burada olduğu gibi 2 değişken birbiri ile tam ilişkili ise çoklu doğrusal bağlantı söz konusudur.

Bu tam çoklu doğrusal bağlantıdır.

12 1r : 2 değişken arasında korelasyon katsayısı 1’e eşittir. Böyle bir durumda ’leri

bulamayız. Çünkü ( ' )X X matrisinin determinantı 0’dır. Bu nedenle tersini alamayız. Buna

bağlı olarak da ’lar tahmin edilemez.

Çoklu doğrusal bağlantı şüphesiz zaman serilerinde ortaya çıkar ama kesit verilerinde de ortaya

çıkabilir. Büyük bir işletmenin de küçük bir işletmenin de üretimleri kullanılan emek ve

sermayeye bağlıdır. Büyük işletme daha çok emek ve sermaye kullanır. İşletme büyüdükçe

sermaye ve emek de büyür. Bu kesit verisi olmasına rağmen sermaye ve emek arasında ilişki

söz konusudur.

Çoklu doğrusal bağlantı iki yönü ile otokorelasyon ve heteroskedasiteden farklıdır:

- Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite de olabilir

fakat çoklu doğrusal bağlantı söz konusu değildir. Diğer bir ifade ile otokorelasyon ve

heteroskedasite basit ve çoklu regresyon modelleri ile ilgili olduğu halde çoklu doğrusal

bağlantı sadece çok değişkenli regresyon modellerine özgüdür.

- Otokorelasyon ve heteroskedasite anakütle ile ilgilidir. Çoklu doğrusal bağlantı ise

örnekle ilgili bir sorundur. Yani çoklu doğrusal bağlantı istatistiksel bir problem olmayıp

verilerdeki yetersizliklerden meydana gelmektedir. Ele alınan dönemde 2 ve ya daha fazla

değişken birlikte değişme eğiliminde olabilir. Çoklu doğrusal bağlantıdan kurtulmanın bir yolu

da gözlem sayısını arttırmaktır.

358

13.1. Çoklu Doğrusal Bağlantının Sebepleri

Çoklu doğrusal bağlantıya sebep olan unsurlar aşağıdaki sıralanmaktadır:

1) Modelde yer alan bağımsız değişkenlerin aynı trende sahip olmaları:

İktisadideğişkenlerin zaman içinde birlikte değişme eğilimleri vardır. Çünkü genellikle aynı

unsurlardan etkilenirler. Dolayısıyla herhangi bir iktisadi olay sonucunda iktisadi değişkenler

gecikmeli de olsa aynı davranış kalıbı içinde değişiklik gösterirler. Ör: İktisadi gelişme

dönemlerinde gelir, tüketim, istihdam ve yatırımlar artma eğilimindedir. Daralma dönemlerinde

ise bu değişimin tersi bir davranış kalıbına girerler. Zaman serilerindeki büyüme ve genel eğilim

çoklu doğrusal bağlantının en önemli nedenlerindendir.

2) Veri tabanının yeteri kadar geniş tutulmaması nedeniyle bazı bağımsız değişkenlerin

beraberce değişmeleri

3) Modelde bağımsız değişkenlerin trend etkisine tabi olan bir gecikmeli değişkenin

bulunması

0 1 2 1t t tC Y Y

Aynı trende sahip gelir değişkenlerinin arasında çoklu doğrusal bağlantı söz konusudur.

13.2. Çoklu Doğrusal Bağlantının Dereceleri

i-Değişkenler arasında kuvvetli bir ilişkinin olması

0 1 1 2 2 .......i k kY X X X u , 1X ve

2X arasında kuvvetli bir çoklu doğrusal

bağlantı varsa 12r 1’ yakın bir değerdir. Modeli EKK yöntemiyle çözdüğümüzü düşünelim.

1

1

ˆ Y

X

, 2

2

ˆ Y

X

İki değişken arasında böyle 1’e yakın çoklu doğrusal bağlantı varsa EKK yöntemiyle tahmin

edilen 1 ve 2 güvenilir olmayacaktır. 1 sadece 1X ’in değil 2X ’nin de kendine yüklediği

görevi ifade edecektir.

359

ii-Tam çoklu doğrusal bağlantı

Modelde tam çoklu doğrusal bağlantı varsa yani 2 değişken arasındaki basit korelasyon

katsayısı 1’ eşitse daha önce de ifade edildiği gibi ( ' )X X matrisinin determinantı 0 olacaktır.

Tam çoklu doğrusal bağlantı demek ( ' )X X matrisinde 2 ve ya daha fazla vektörün birbiri ile

doğrusal olarak bağlantılı olması demektir. Matris-determinant ilişkisine göre 2 vektörü birbiri

ile ilişkili olan bir matrisin determinantı 0’dır ve dolayısıyla tersi alınamaz. Böylece modelin

parametreleri tahmin edilemez. Eğer modelde tam değil fakat kuvvetli bir çoklu doğrusal

bağlantı varsa bu durumda determinant 0’a yaklaşacak ve ( ' )X X matrisinin elemanları çok

büyük değer alacaktır. Bunun sonucu ise Varyans-kovaryans matrisindeki elemanları

büyümesidir.

0

1

2

( )

( )

( )

Var

Var kov Var

Var

2 1ˆ( ) ( ' )Var Kov X X

Varyanslarda meydana gelecek büyüme dolayısıyla standart hatalar da büyüyecektir. Böylece

hesaplanmış t hesap değeri küçülecektir. Aslında bir bağımsız değişken, bağımlı değişken

üzerinde çok etkili olabilir ama t testleri sonucu anlamsız çıkabilmektedir.

iii.Değişkenler arasında ilişki olmaması

2 bağımsız değişken arasında ilişki yoksa korelasyon katsayısı 0’dır. Korelasyon katsayısının 0

olması, kovaryansın 0 olması durumunda mümkündür. Eğer modelde çoklu doğrusal bağlantı

yoksa ( ' )X X matrisi diyagonel bir karaktere sahiptir.

1

2

3

0 0

( ' ) 0 0

0 0

X X

1

1

2

3

1 0 0

( ' ) 0 1 0

0 0 1

X X

Böyle bir model; kovaryansızhomoskedasite ve ya heteroskedasite özelliğine sahiptir.

360

13.3. Çoklu Doğrusal Bağlantının Sonuçları

-Regresyon denklemindeki parametrelerin değerlerinin belirsiz olması

-Parametrelerin varyanslarının ve dolayısıyla güven aralıklarının büyümesi

-Hesaplanan t hesap değerlerinin küçülmesi

-R2’nin olduğundan fazla büyümesi

-Tahmin edilen parametrelerin ve standart hatalarının verilerdeki küçük değişikliklerden önemli

derecede etkilenmesi

0 1 1 2 2 3 3

1 2 3

ˆ ˆ ˆ ˆ

ˆ ˆ ˆ( ) ( ) ( )

Y X X X u

Se Se Se

modelinden R2 hesaplanmış olsun ve F testinde bütün parametreler 1 2 3ˆ ˆ ˆ, , birlikte test

edildiğinde anlamlı çıkarken, t testi ile parametreler tek tek test edildiğinde anlamsız

çıkabilirler. Bu durum tipik bir çoklu doğrusal bağlantı örneğidir. Tahmin edilen parametreler

hakkında 0.05 önem derecesi ile yapılan F ve t testleri önemli bir bilgi vermektedir.

Modelde yer alan bağımsız değişkenlerin topluca bağımlı değişken üzerinde etkili olup

olmadığını gösteren F testinin olumlu sonuç vermesi R2’nin güvenilir olduğunun bir

göstergesidir. Buna karşılık değişkenlerin Y üzerindeki etkisini tek tek test eden t testi sonuçları

olumsuzsa, bu durumda modelde çoklu doğrusal bağlantıdan şüphe edilir. Çoklu doğrusal

bağlantı durumunda tahmin edilen parametrelerin standart hataları büyüktür fakat tahmin edilen

parametreler eğilimsizdirler.

13.4. Çoklu Doğrusal Bağlantının Tespiti

1- Modelde çok yüksek bir R2hesaplandığı halde regresyon modelindeki parametrelere

uygulanan t testlerinin anlamsız sonuç vermesi çoklu doğrusal bağlantının en belirgin

özelliğidir. R2değeri büyük olduğundan F testi olumlu sonuç verecektir.

2- Çoklu doğrusal bağlantının derecesinin tespitinde diğer bir yol ( ' )X X matrisinin

determinantının hesaplanmasıdır. ' 0X X ise tam çoklu doğrusal bağlantı vardır ve ’lar

hesaplanamaz. ' 0X X ’a yaklaşırsa kuvvetli bir çoklu doğrusal bağlantı halini ifade

etmektedir.

361

3- 0 1 1 2 2ˆ ˆ ˆY X X u modelinde yer alan değişkenler arasındaki basit korelasyon

katsayılarına bakarak da çoklu doğrusal bağlantının olup olmadığı konusunda fikir sağlanabilir.

rY1=Bağımlı değişken ile 1. bağımsız değişken arasındaki korelasyon katsayısı,

rY2=Bağımlı değişken ile 2. bağımsız değişken arasındaki korelasyon katsayısı,

r12=2 bağımsız değişken arasındaki korelasyon katsayısı olduğunda

r12>rY1ver12>rY2 ise 1X ve

2X arasında çoklu doğrusal bağlantı vardır.

4- Belirginlik katsayısının kullanılması: Modelden bir bağımsız değişken çıkarıldığında R2çok

az değişiyorsa çoklu doğrusal bağlantıdan şüphelenilir.

5- Varyans büyütme faktörü (VİF): Varyans büyütme faktörü kullanılarak parametre

tahminlerinin ve varyanslarının çoklu doğrusal bağlantı nedeniyle gerçek değerinden ne kadar

uzaklaştığı belirlenmektedir.

r12= 1X ve

2X arasındaki basit korelasyon katsayısı.

12

1

1VİF

r

olarak hesaplanmaktadır.

r12=0 ise VİF=1 1X ve 2X arasında ilişki yoktur.

r12=1 ise VİF=∞ 1X ve 2X arasında ilişki vardır.

Bunu daha fazla geliştirebiliriz. Elimizde k tane bağımsız değişken varsa, k tane de R2 vardır.

Buna göre de k tane varyans büyütme faktörü (VİF) hesaplanır.

1 2

2

. , ...

1

1i kX X X X

VİFR

5var .

10

VİFçoklu doğrusal bağlantı dır

VİF

Çoklu doğrusal bağlantı arttıkça, VİF faktörü büyümektedir.

362

Uygulamalar

363

Uygulama Soruları

1) Çoklu doğrusal bağlantı nedir?

Klasik doğrusal regresyon modellinde yer alan 2 veya daha fazla bağımsız değişkenin

doğrusal bağlantılı olmadığı varsayılmıştır. Bundan bir sapma olduğunda diğer bir ifade

ile bağımsız değişkenler arasında doğrusal bir bağlantının varlığı çoklu doğrusal

bağlantı problemini göstermektedir

2) Çoklu doğrusal bağlantı hangi yönleriyle otokorelasyon ve heteroskedasiteden

ayrılmaktadır?

(i) Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite de olabilir

fakat çoklu doğrusal bağlantı söz konusu değildir. Diğer bir ifade ile otokorelasyon ve

heteroskedasite basit ve çoklu regresyon modelleri ile ilgili olduğu halde çoklu doğrusal

bağlantı sadece çok değişkenli regresyon modellerine özgüdür.

(ii) Otokorelasyon ve heteroskedasite anakütle ile ilgilidir. Çoklu doğrusal bağlantı ise

örnekle ilgili bir sorundur. Yani çoklu doğrusal bağlantı istatistiksel bir problem

olmayıp verilerdeki yetersizliklerden meydana gelmektedir. Ele alınan dönemde 2 ve

ya daha fazla değişken birlikte değişme eğiliminde olabilir. Çoklu doğrusal bağlantıdan

kurtulmanın bir yolu da gözlem sayısını arttırmaktır.

3) Çoklu doğrusal bağlantının sebepleri nelerdir?

- Modelde yer alan bağımsız değişkenlerin aynı trende sahip olmaları

- Veri tabanının yeteri kadar geniş tutulmaması nedeniyle bazı bağımsız değişkenlerin

beraberce değişmeleri

- Modelde bağımsız değişkenlerin trend etkisine tabi olan bir gecikmeli değişkenin

bulunması

4) Değişkenler arasında tam çoklu doğrusal bağlantı olması halinde parametrelerin

niçin tahmin edilemediğini anlatınız.

2 1

2 15

X X

X X

Burada olduğu gibi 2 değişken birbiri ile tam ilişkili ise çoklu doğrusal bağlantı söz

konusudur. Bu tam çoklu doğrusal bağlantıdır.

364

12 1r : 2 değişken arasında korelasyon katsayısı 1’e eşittir. Böyle bir durumda ’leri

bulamayız. Çünkü ( ' )X X matrisinin determinantı 0’dır. Bu nedenle tersini alamayız.

Buna bağlı olarak da ’lar tahmin edilemez.

5) Çoklu doğrusal bağlantıyı tespit etme yöntemleri nelerdir?

çok yüksek bir R2 , t testlerinin anlamsız sonuç vermesi, r12>rY1ver12>rY2 , Modelden bir

bağımsız değişken çıkarıldığında R2çok az değişiyorsa çoklu doğrusal bağlantıdan

şüphelenilir.

6) Aralarındaki basit korelasyon katsayısı 0.33 olan iki değişken arasında çoklu doğrusal

bağlantı olup olmadığını araştırınız.

r12=0,33

12

1

1

11,49

1 0,33

1,49 5

VİFr

VİF

çoklu doğrusal bağlantı sorun teşkil etmeyecektir.

365


Bu bölümde, çoklu doğrusal bağlantının tanımı, sebepleri, dereceleri ile tespit etme

yöntemleri anlatılmıştır.

366

Bölüm Soruları

1) “Çoklu doğrusal bağlantı…………………………………………. özgü,

………………….ile ilgili bir sorundur.” İfadesindeki boşlukları doldurunuz.

a) Doğrusal olmayan modellere ; anakütle

b) Modelin parametrelerine ; örnek

c) Model dışında kalan değişkenlere; anakütle

d) Modelin parametrelerine; anakütle

e) Çok değişkenli regresyon modellerine; örnek

2) 2 bağımsız değişken arasında korelasyon katsayısı 1’e eşit ise aşağıdaki ifadelerden

hangisi doğrudur?

a) Böyle bir durumda ’leri bulunur, çünkü ( ' )X X matrisinin determinantı 0 değildir

b) Böyle bir durumda ’leri bulunur, çünkü ( ' )X X matrisinin determinantı 0’dır.

c) Böyle bir durumda ’leri bulanamaz, çünkü ( ' )X X matrisinin determinantı 0’dır.

d) Böyle bir durumda ’leri bulunamaz, çünkü ( ' )X X matrisinin determinantı 0

değildir.

e) Böyle bir durumda ’leri bulunamaz, çünkü ( )X matrisinin determinantı 0’dır.

3) Aşağıdaki ifadelerden hangisi doğrudur?

a) Basit bir regresyon modelinde otokorelasyon olmayacak, heteroskedasite olabilir

fakat çoklu doğrusal bağlantı söz konusu değildir.

b) Basit bir regresyon modelinde otokorelasyon olmayacak, heteroskedasite de

olmayacak, fakat çoklu doğrusal bağlantı söz konusu değildir.

c) Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite olmayacak,


d) Basit bir regresyon modelinde otokorelasyon, heteroskedasite ve çoklu doğrusal

bağlantı söz konusu değildir.

e) Basit bir regresyon modelinde otokorelasyon da olabilir, heteroskedasite de olabilir

367


4) Aşağıdakilerden hangisi çoklu doğrusal bağlantının sonuçlarından biri değildir?

a) Regresyon denklemindeki parametrelerin değerlerinin belirsiz olması

b) Parametrelerin varyanslarının ve dolayısıyla güven aralıklarının büyümesi

c) Hesaplanan t hesap değerlerinin küçülmesi

d) R2’nin olduğundan fazla büyümesi

e)Tahmin edilen parametrelerin ve standart hatalarının verilerdeki küçük

değişikliklerden önemli derecede etkilenmemesi

5) Aşağıda verilmiş olan ifadelerden hangisi doğrudur?

a) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları

küçüktür fakat tahmin edilen parametreler eğilimlidir.

b) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları

küçüktür fakat tahmin edilen parametreler eğilimsizdirler.

c) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları

büyüktür fakat tahmin edilen parametreler eğilimlidir.

d) Çoklu doğrusal bağlantı durumunda tahmin edilen parametrelerin standart hataları

büyüktür fakat tahmin edilen parametreler eğilimsizdirler.

e) Çoklu doğrusal bağlantı durumunda parametreleri tahmin edilemez

6) 0 1 1 2 2i i i iY X X u modelinde kullanılan bağımsız değişkenlerin değerleri aşağıda

verilmiştir.

X1 X2

2 10

1,5 7,5

1,8 9

2,4 12

3 15

368

Buna göre aşağıdaki ifadelerden hangisi doğrurdur?

a) ' 0X X , çoklu doğrusal bağlantı vardır ve ’lar hesaplanamaz.

b) ' 0X X tam çoklu doğrusal bağlantı yoktur ve ’lar hesaplanamaz.

c) ' 0X X tam çoklu doğrusal bağlantı vardır ve ’lar hesaplanır.

d) ' 0X X tam çoklu doğrusal bağlantı vardır ve ’lar hesaplanamaz.

e) ' 0X X tam çoklu doğrusal bağlantı yoktur ve ’lar hesaplanamaz.

7) 0 1 1 2 2i i i iY X X u

modelinde r12=0,95 olmak üzere aşağıdaki ifadelerden

hangisi doğrudur?

a) VİF=1 1X ve

2X arasında ilişki yoktur.

b) VİF=2 1X ve


c) VİF=4 1X ve


d) VİF=10 1X ve

2X arasında ilişki vardır.

e) VİF=20 1X ve 2X arasında ilişki vardır.

8) 0 1 1 2 2i i i iY X X u modelinde r12=0,05 olmak üzere aşağıdaki ifadelerden

hangisi doğrudur?

a) VİF=1.05 1X ve


b) VİF=2.05 1X ve


c) VİF=4.05 1X ve


d) VİF=10.05 1X ve 2X arasında ilişki vardır.

e) VİF=20.05 1X ve 2X arasında ilişki vardır.

369

9) 0 1 1 2 2i i i iY X X u

modeli için aşağıdaki ifadelerden hangisi doğrudur?

a) r12>rY1 ve r12>rY2 ise 1X ve


b) r12>rY1 ve r12<rY2 ise 1X ve


c) r12<rY1 ve r12>rY2 ise 1X ve


d) r12>rY1 ve r12>rY2 ise 1X ve

2X arasında çoklu doğrusal bağlantı yoktur.

e) r12<rY1 ve r12<rY2 ise 1X ve


10)

2

2

110 0, 0,

. .(0

15 13

66) (0,18) (0,18)

0,96

,

i i iY X X

R

s e

modeli için aşağıdaki ifadelerden hangisi doğrudur?

a) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamsız sonuç vermesi

çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri büyük olduğundan F testi olumlu

sonuç verecektir.

b) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamsız sonuç vermesi

çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri küçük olduğundan F testi olumsuz

sonuç verecektir.

c) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamsız sonuç vermesi

çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri büyük olduğundan F testi olumsuz

sonuç verecektir.

d) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamlı sonuç vermesi

çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri büyük olduğundan F testi olumlu

sonuç verecektir.

e) Regresyon modelindeki parametrelere uygulanan t testlerinin anlamlı sonuç vermesi

çoklu doğrusal bağlantının en belirgin özelliğidir. R2değeri küçük olduğundan F testi olumsuz

sonuç verecektir.

370

Cevaplar

1)e

2)c

3)e

4)e

5)d

6)b

7)e

8)a

9)a

10)a

371

14. SPESİFİKASYON HATALARI

372


14.1. Modelin Büyüklüğü İle İlgili Hatalar

14.2. Modelin Matematiksel Kalıbı İle İlgili Hatalar

14.3. Ölçme Hataları

373


1) Ekonometrik bir modelin spesifikasyonunda ne gibi hatalar çıkmaktadır?

2) Modelin büyüklüğüne ilişkin yapılan hatalar nelerdir?

3) Modelin matematiksel kalıbı ile ilgili hatalar neler olabilecektir?

4) Değişkenlerdeki yapılabilecek ölçme hataları nelerdir?

374




Spesifikasyon

Hataları

Ekonometrik bir modelin

spesifakasyonun belirlenmesi

noktasında nasıl bir yol

izlenmesi gerekliliği kazanımı

Ders notları

Spesifikasyon

Hataları

Modelin büyüklüğünün tespit

edilmesi

Ders notları, uygulamaları tekrar

etmeli

375

Anahtar Kavramlar

Model spesifikasyonu

Model kurma hatası

Modelin matematiksel kalıbı

Ölçme hataları

376

Giriş

Bu kısımda, ekonometrik bir model oluştururken bilerek ya da bilmeyerek yapmış

olduğumuz model kurma hataları incelenecektir. Söz konusu hatalara ne şekilde düşülebileceği

üzerinde durulacak ve tespit etme yöntemlerine değinilecektir.

377

14.1. Modelin Büyüklüğü İle İlgili Hatalar

Modelin büyüklüğü ile ilgili olan hatalarda modele gereksiz bir değişken ilave edilmiş

olabilir ya da model üzerinde etkisi olan gerekli bir değişken dışlanmış olabilir.

0 1 1 2 2ˆ ˆ ˆY X X u şeklinde olması gereken bir modelde bilerek yada bilmeyerek

2X

değişkenini model dışında bıraktığımızı ve

0 1 1ˆ ˆY X e

olarak tahmin ettiğimizi düşünelim. 1X ve

2X arasında bir bağlantı ve2X ’yi model dışında

bırakmışsak 2. regresyon denklemindeki1X ;

2X ’nin etkisini de göstermektedir. 0 ve

1

eğilimlidir. Çünkü 1X ,

2X ’nin de etkisini üstlenecektir ve 1 ’nin beklenen değeri 1 ’e eşit

olmayacaktır.

0 0ˆˆ( )E ,

1 1ˆˆ( )E

Böyle bir durumda gözlem sayısı artmış olsa dahi eğilimlilik giderilemez, düzeltilemez.

r12=0 ise bu durumda 1 eğilimsizdir fakat

0 eğilimlidir. Bir değişkeni model dışında

bırakırsak bundan dolayı anakütle hata terimi varyansı da yanlış tahmin edilmektedir.

2ˆˆ

u

n k

Model dışında bırakılan değişken hem 2u ’nin hem de (n-k) değerinin yanlış belirlenmesine

sebep olmaktadır.

2

1 2

1 12

ˆˆ( )(1 )

Sex r

,

2

1 2

1

ˆˆ( )Se

x

Modelde dışlanmış bir değişken varsa tahmin edilen 1 ’in varyansı dolayısıyla standart hataları

eğilimlidir. Yani 1 ’in standart hatasından farklıdır. Standart hataların kullanıldığı hipotez

testleri ve güven aralıkları yanıltıcı sonuçlar vermektedir. Çünkü kalıntıların kareleri toplamı

ve serbestlik dereceleri farklı olmaktadır. Özetlemek gerekirse, modelde dışlanmış bir değişken

378

olması dolayısıyla tahmin edilen parametreler eğilimli ve tutarsız olmaktadır. 2u ve(n-k)

serbestlik derecesi yanlış belirlendiğinden anakütle hata terimi varyansı da yanlış tahmin

edilmektedir. Güven aralıkları ve hipotez testleri yanıltıcıdır. Az değişkenle tahmin edilmiş

küçük modelin standart hataları daha büyük olmaktadır.

Bunun yanı sıra modele gereksiz bir değişken eklenmesi durumu da spesikasyon hatasına sebep

olmaktadır.

0 1 1ˆ ˆY X e şeklinde oluşturulması gereken bir modele gereksiz bir değişken ilave edip;

0 1 1 2 2ˆ ˆ ˆY X X u modelini tahmin etmiş olabiliriz. Bu durumda tahmin edilen

parametreler eğilimsiz ve tutarlıdır.

0 0ˆˆ( )E ,

1 1ˆˆ( )E

Anakütle hata terimi varyansı doğru tahmin edilmiştir. Güven aralıkları ve hipotez testleri

güvenilirdir. Fakat 2. modelin varyansları dolayısıyla standart hataları 1. modelden daha

büyüktür.

1 1

1 1

ˆˆ( ) ( )

ˆˆ( ) ( )

Var Var

Se Se

Modele gereksiz bir değişken ilave edildiğinde söz konusu değişkenin anlamlılığının t testi ile

sınanması gereklidir.

0 1 1 2 2ˆ ˆ ˆY X X u şeklinde oluşturulmuş modeli ele alırsak; X2 değişkeninin modelde

yer alıp almamasına karar verebilmek için2 ’nin istatistiksel olarak anlamlı olup olmadığını

araştırmalıyız.

0 2

1 2

ˆ: 0

ˆ: 0

H

H

2 parametresi anlamlı iseX2 değişkenimodelde yer almalıdır. 2 anlamsız iseX2

değişkenimodelde yer almamalıdır.

Örnek 1: Aşağıdaki modelde yer alan X2değişkeninin ilave edilmesinin gerekli olup olmadığını

sınayınız?

379

2

1 26955.495 5.22 4.55 0.928

: ( 2.35) (11.39) ( 0.34)

Y X X R

t

X2değişkeninin anlamlılığını test etmemiz gerekmektedir.

0 2

1 2

: 0

: 0

H

H

(0.05;12)

0.34

2.179

hesapt

t

; 0 :hesap tablot t H kabul

Modele ilave edilmiş değişken istatistiksel olarak anlamsız çıktığından dolayı X2

değişkeninin gereksiz bir değişken olduğu söylenebilmektedir.

14.2. Modelin Matematiksel Kalıbı İle İlgili Hatalar

Model kurma hatasına sebep olan diğer bir hata türü ise modelin matematiksel kalıbı ile ilgilidir.

Doğrusal olarak kurulması gereken bir modeli;

0 1 1ˆ ˆY X e

bilerek ya da bilmeyerek kareli olarak kurduğumuzu düşünelim.

2

0 1 1 2 1ˆ ˆ ˆY X X v

Böyle bir durumda da model kurma hatasına düşmüş sayılırız. Böyle bir hataya düşmemek için

değişkenler arasındaki ilişkiye doğru bir şekilde karar vermemiz gerekmektedir.

Dışlanmış değişkenler ve yanlış fonksiyonel kalıp için sınamalar

Düzeltilmiş 2R ( 2R ) değerleri yüksek, t değerleri anlamsız, parametrelerin işaretleri yanlış ve

Durbin Watson istatistiği modelde otokorelasyon olduğunu gösteriyorsa önemli bir değişken

modelden dışlanmıştır ya da modelin matematiksel kalıbı yanlış belirlenmiştir. Bunu sınamak

için kullanılan yöntemler aşağıdaki gibidir.

1-Kalıntıların incelenmesi:

380

Eğer modelden önemli bir değişken dışlanmış ya da matematiksel kalıp yanlış belirlenmişse

kalıntıların grafiği gelişigüzel dağılmayacaktır yani belirli bir görüntü sergileyecektir.

Kalıntılar 0 ekseni etrafında gelişigüzel dağılmalıdır. Eğer böyle değilse kalıntılar birbiri ile

ilişkili olacak ve otokorelasyon ortaya çıkacaktır.

Örnek: Aşağıda verilmiş iki modelden birinin matematiksel formunun yanlış belirlenmiş

olduğunu düşünelim.

1) 2

0 1 1 2 1Y X X v

2) 2 3

0 1 1 2 1 3 1Y X X X e

Bu modellere ait kalıntılar aşağıdaki gibidir.

381

1.modelde kalıntılar hem 0’dan farklı değerler izlemekte hem de belli bir görüntü

sergilemektedir. Hâlbuki istenen durum kalıntıların gelişigüzel dağılmasıdır. 2.modeldeki

kalıntılar ise 0 etrafında rastgele bir dağılım izlemektedir. Böyle bir durumda 2. modelin

matematiksel kalıbının doğru olduğu söylenebilmektedir.

2-Durbin Watson istatistiği:

0 1 1 2 2ˆ ˆ ˆY X X u şeklinde tahmin edilmesi gereken bir modeli gerekli bir değişkeni

dışlayarak;

0 1 1ˆ ˆY X e

şeklinde kurmuş olabiliriz. Model kurma hatası olup olmadığını tespit etmek için daha önce

otokorelasyonun test edilmesi yöntemlerinde anlatılmış olan Durbin-Watson testi ile sınamak

mümkündür. Bunun için takip edilmesi gereken aşamalar aşağıdaki gibidir:

- 2.model tahmin edilir ve kalıntıları hesaplanır.

- Hata terimleri X2 değişkeninin değerlerine göre küçükten büyüğe doğru sıralanır.

Diğer bir ifade ile X2 değişkeni ile kalıntılar birlikte sıralanır.

- Sıralanmış olan bu kalıntılardan hareketle DW istatistiği elde edilir.

2

1

2

2

1

ˆ ˆ( )

ˆ( )

t n

t t

t

t n

t

t

u u

DW

u

=

-

=

=

=

-

=å

å

- DW değeri DW tablosuna göre anlamlı ise model yanlış kurulmuştur.

382

0

1

:

:

H Model doğru kurulmuştur

H Model yanlış kurulmuştur

Örnek:

2

0 1 1 2 1 modY X X v Kısıtlı el

2 3

0 1 1 2 1 3 1 modY X X X e Kısıtsız el

Öncelikle kısıtlı modeli EKK ile tahmin ediyoruz.

2

1 1

2

222.383 8.02 2.54 10

: (9.468) ( 0.818) (2.925) 0.92

Y X X n

t R

1X ve 2

1X değerleri yerine koyulup Y değerleri elde edilir. ˆ( )Y Y ’den de kalıntılar elde edilir.

Kalıntılar modelden dışlanmış olan 3

1X değişken değerlerine göre sıralanır. Sıralanmış olan

kalıntılar kullanılarak DW istatistiği hesaplanır.

0.67DW

0

1

:

:



Modelde pozitif otokorelasyonun bulunması 0H hipotezinin reddedildiğini göstermektedir.

Dolayısıyla model kurma hatası söz konusudur.

3-Ramsey-Reset testi:

Model kurma hatasının olup olmadığını test etmek için kullanılan bir diğer yöntem Ramsey-

Reset testidir. Testin aşamaları aşağıdaki gibidir:

383

0 1 1 modY X v Doğrusal el

- Ele alınan model tahmin edilir ve Y değerleri eldeedilir.

- Kalıntıların Y değerlerine göre grafiği çizilir.

Elde edilen bu grafiğe göre Y’nin kareli ve küplü değerleri de modele katılarak yeni bir model

oluşturulur ve tahmin edilir.

Yeni model: 2 3

0 1 1 2 3Y X Y Y e

Eski model:0 1 1Y X v

- Yeni eklenen bu yeni değişkenlerin 2R ’yi anlamlı şekilde arttırıp arttırmadığı F

testi ile sınanır.

2 2

21

yeni eski

yeni

R R mF

R n k

Buradaki m: yeni ilave edilen bağımsız değişken sayısıdır. n gözlem sayısı olup, k ise yeni

modeldeki parametre sayısını ifade etmektedir.

- 0

1

:

:



Hesaplanan F istatistiği, m ve (n-k) serbestlik dereceli F tablo değerleri ile karşılaştırılır. F

istatistiği kritik değerden büyükse 0H hipotezi reddedilir. Yani model yanlış kurulmuştur.

Örnek:

2

1166.467 19.93 10 0.84Y X n R

384

Model tahmininden elde edilmiş Y değerleri hesaplanmıştır ve Y değerleri ile kalıntıların

grafiği çizilmiştir.

Y’nin kareli ve küplü terimleri modele ilave edilmiştir. Eğer grafik parabol olmuş olsaydı

sadece Y’nin kareli değerlerini ilave etmemiz yeterli olurdu.

Yeni model: 2 3 2

1ˆ ˆ2140.72 476.6 0.09 0.001 0.99Y X Y Y R

Bu modele F testi uygulanır.

2 2

(0.05,2,6)2

0.99 0.84 2284.4 , : 5.14

1 0.99 10 41

yeni eski

yeni

R R mF F

R n k

F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model yanlış kurulmuştur.

(1. model yanlış kurulmuştur, model doğrusal olmamalıdır).

14.3. Ölçme Hataları

Bağımlı ve bağımsız değişkenlere ait verilerde hesaplama, yuvarlama, ara değer verme vb.

nedenlerle ölçme hataları ile karşılaşılmaktadır.

-Bağımlı değişkende ölçme hataları:

Bu kısımda, bağımlı değişken Y’de herhangi bir nedenle ölçme hatası varsa yani Y , *Y olarak

hesaplanmışsa bunun sonuçlarının ne olacağı üzerinde durulacaktır.

*

0 1 1Y X u

şeklindeoluşturulmuş bağımlı değişkeninde ölçme hatası olan bir model olduğunu düşünelim.

buna bağlı olarak doğru model;

385

*

*

0 1 1

Y

Y X u e Y e

olacaktır. Model daha da düzenlenirse;

0 1 1

v

Y X u e

haline dönüşecektir. Açıkça anlaşılabileceği gibi bağımlı değişkende bir ölçme hatası

olduğunda bu durum sadece hata terimi etkilemektedir. Hata terimi e kadar büyümektedir.

Bağımlı değişkendeki bu ölçme hatası parametrelerin eğilimsizlik ve tutarlılık özelliklerini

etkilememektedir. Fakat hata teriminin varyansı olduğundan büyük tahmin edilmektedir. Bu

nedenle hesaplanan varyanslar etkin değildir.

-Bağımsız değişkende ölçme hataları:

Modelde yer alan bağımsız değişkenlerde herhangi bir sebeple ölçme hatası olduğunu

düşünelim. Ölçme hatası yapılan bağımsız değişken *X ile gösterilirse;

*X X e

*X X e

olmaktadır. Buna bağlı olarak model düzenlenirse;

*

0 1

0 1

0 1 1

0 1 1

0 1

( )

( )

v

Y X u

Y X e u

Y X e u

Y X u e

Y X v

haline dönüşmektedir. Açıkça görüldüğü gibi1 ’den dolayıhata terimleri ile bağımsız değişken

ilişkilidir.

( , ) 0KOV X u

Bu da EKK yönteminin önemli bir varsayımını çiğnemektedir. EKK tahmin edicileri

hem eğilimli hem de tutarsız olmaktadır.

386

Uygulamalar

387

Uygulama Soruları

1) Model spesifikasyonu ne demektir?

Modelin belirlenmiş olan matematiksel kalıbını ifade etmektedir.

2) Spesifikasyon hataları kaç şekilde karşımıza çıkmaktadır?

Modelin büyüklüğü ile ilgili hatalar

Modelin matematiksel kalıbı ile ilgili hatalar

3) Model spesifikasyonunun yanlış olduğunu ilk bakışta nasıl anlayabiliriz.

Eğer modelden önemli bir değişken dışlanmış ya da matematiksel kalıp yanlış belirlenmişse

kalıntıların grafiği gelişigüzel dağılmayacaktır yani belirli bir görüntü sergileyecektir.

4) Önemli bir değişkenin modelden dışlanmasının meydana getirdiği sonuçlar nelerdir?

EKK tahmin edicileri hem eğilimli hem de tutarsız olmaktadır.

5. Tahmin edilen aşağıdaki modelde X2 değişkeninin gerekli bir değişken olup olmadığını

araştırınız.

2

1 20.985 1.33 4.35 0.74

: ( 5.50) (1.33) ( 1.34)

Y X X R

t

388

0 2

1 2

(0.05;12)

0

: 0

: 0

1.34

2.179

:

hesap

hesap tablo

H

H

t

t

t t H kabul

Modele ilave edilmiş değişken istatistiksel olarak anlamsız çıktığından dolayı X2 değişkeninin

gereksiz bir değişken olduğu söylenebilmektedir.

6.Aşağıda matematiksel kalıpları birbirinden farklı olan 2 model oluşturulmuştur.

1) 0 1 1 2 2Y X X v

2) 2 2

0 1 1 2 2 3 1 4 2Y X X X X e

Modellerden elde dilen kalıntıların grafiği aşağıdaki gibi ise hangi modelin uygun model

olduğu söylenebilir.

1. Modelden elde edilen kalıntılar biribirleriyle ilişki halindedir ve otokorelasyon olduğuna

kanaat getirebilecektir fakat 2. Modelde kalıntılar gelişi güzel dağılmaktadır. Bundan dolayı 2.

Model uygun olacaktır.

7) Aşağıda belirtilmiş durumları dikkate alarak sırasıyla cevaplandırınız.

i. 0 1 1 2 2ˆ ˆ ˆY X X u şeklinde tahmin edilmesi gereken bir model gerekli bir

değişkeni dışlanarak 0 1 1ˆ ˆY X e şeklinde tahmin edilmiştir. Elde edilmiş kalıntıların X2

değişkenine göre sıralanmasından elde edilmiş Durbin-Watson değeri de 1.71 olarak

bulunmuştur. Buna göre modelde spesifikasyon hatası olup olmadığını araştırınız.

0

1

:

:



389

1.64<1.71<2.36

0H hipotezinin reddedilememiştirdolayısıyla model kurma hatası söz konusu değildir.

ii. 2

112.25 1.81 20 0.75Y X n R

şeklinde tahmin edilmiş bir modelde spesifikasyon hatası olup olmadığını araştırmak amacıyla,

bu modelin Y değerlerinin grafiği incelenmiş ve modele Y değerlerinin karelerinin ilave

edilmesine karar verilmiştir.

2 2

1ˆ5.2 2.7 0.05 0.87Y X Y R

İlk modelde spesifikasyon hatası olup olmadığını araştırınız.

0

1

:

:



2 2

(0.05,1,17)2

0.87 0.75 115.69 , : 4,95

1 0.87 20 31

yeni eski

yeni

R R mF F

R n k

iii. Bağımlı değişkende bir ölçme hatası olması durumunda sonuçlar nasıl

değişmektedir?

Bağımlı değişkende bir ölçme hatası olduğunda bu durum sadece hata terimi

etkilemektedir. Hata terimi e kadar büyümektedir. Bağımlı değişkendeki bu ölçme

hatası parametrelerin eğilimsizlik ve tutarlılık özelliklerini etkilememektedir. Fakat

hata teriminin varyansı olduğundan büyük tahmin edilmektedir. Bu nedenle

hesaplanan varyanslar etkin değildir.

390

iv. Bağımsız değişkende bir ölçme hatası olması durumunda sonuçlar nasıl

değişmektedir?

EKK tahmin edicileri hem eğilimli hem de tutarsız olmaktadır.

391


Model kurma hatalarından modelin fonksiyonel biçiminin yanlış belirlenmesi,

dışlanmış değişken, ilgisiz değişken, ölçe hatalarını ve sonuçlarının neler olduğunu öğrendik.

Modelin fonksiyonel biçiminin yanlış belirlenip belirlenmediğinin tespiti için izlenmesi

gereken aşamalar tespit edilmiş oldu.

392

Bölüm Soruları

1) Matematiksel kalıpları birbirinden farklı olan 2 model aşağıdaki gibi oluşturulmuştur.

i.0 1 1 2 2 3 1 2Y X X X X v

ii. 2 2

0 1 1 2 2 3 1 4 2Y X X X X e

Modellerden elde dilen kalıntıların grafiği aşağıdaki gibi ise hangi modelin uygun model

olduğu söylenebilir.

a) Her iki modelin de matematiksel kalıbı uygun değildir

b) 1. modelin matematiksel kalıbı uygundur

c) 2. modelin matematiksel kalıbı uygundur

d) Her iki modelin de matematiksel kalıbı uygundur

e) Karar verilemez

2) Aşağıdakilerden hangisi spesifikasyon hatalarından biri değildir?

a) Bağımsız değişkenlerdeki ölçme hataları

b) Modelin matematiksel biçiminin yanlış belirlenmesi

c) Dışlanmış değişken

d) Gereksiz değişken

e) Tahmin edilen parametrenin eğilimli olması

393

3) Aşağıdaki modeller arasında karar vermek için yapılacak Ramsey-Reset testinin F test

istatistiğini hesaplayınız.

2

1

2 3 2

1

166.467 19.93 10 0.84

ˆ ˆ2140.72 476.6 0.09 0.001 0.99

Y X n R

Y X Y Y R

a) 284,4

b) 384,4

c) 484,4

d) 584,4

e) 684,4

4) Aşağıda verilmiş olan model için

2

1 1

2

222.383 8.02 2.54 10

: (9.468) ( 0.818) (2.925) 0.92

Y X X n

t R

1X ve 2





3.67DW

Model kurma hatası var mıdır?

A) DW dL Model kurma hatası yoktur

B) dL DW dU Model kurma hatası yoktur

C) 4dU DW dU Model kurma hatası yoktur

D) 4 dU DW dL Model kurma hatası vardır

E) 4 4dL DW Model kurma hatası vardır

5)

Aşağıda verilmiş olan model için

2 3

1 1 1

2

21.383 8.02 2.54 1,25 35

: (9.468) ( 0.818) (2.925) (1.25) 0.872

Y X X X n

t R

394

1X , 2

1X ve 3

1X değerleri yerine koyulup Y değerleri elde edilir. ˆ( )Y Y ’den de kalıntılar elde

edilir. Kalıntılar modelden dışlanmış olan 4

1X değişken değerlerine göre sıralanır. Sıralanmış

olan kalıntılar kullanılarak DW istatistiği hesaplanır.

0,07DW


A) DW dL Model kurma hatası vardır

B) dL DW dU Model kurma hatası vardır

C) 4dU DW dU Model kurma hatası vardır



6) Aşağıda verilmiş olan model için modelin spesifikasyonunu test ediniz.

2

1

2 3 2

1

1.467 1.93 20 0.84

ˆ ˆ17.72 2.36 3.99 0.43 0.98

Y X n R

Y X Y Y R

A) F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model yanlış

kurulmuştur.

B) F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model yanlış

kurulmamıştır.

C) F istatistiği anlamsızdır. 0H hipotezi reddedildiğinden dolayı model yanlış

kurulmuştur.

D) F istatistiği anlamsızdır. 0H hipotezi reddedildiğinden dolayı model yanlış

kurulmuştur.

E) F istatistiği anlamlıdır. 0H hipotezi reddedildiğinden dolayı model doğru

kurulmuştur.

395

7) Aşağıda verilmiş olan model için Ramsey Reset testinin test istatistiğini bulunuz

2

1

2 3 2

1

1.467 1.93 20 0.84

ˆ ˆ17.72 2.36 3.99 0.43 0.98

Y X n R

Y X Y Y R

A) 7,90

B) 8,90

C) 10,90

D) 11,90

E) 12,90

8) Aşağıdaki gibi verilmiş olan 2 model içerisinden hangisi niçin seçilecektir?

0 1 1

2

0 1 1 2 1

1.model:

2.model:

Y X v

Y X X e

A) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.

B) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.

C) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.

D) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.

E) 2. Model seçilir, X bağımsız değişkeni 0 etrafında rastgele bir dağılım izlemektedir.

396

9) Aşağıda verilmiş olan model için

1

2

222.383 8.02 10

: (9.468) ( 0.818) 0.92

Y X n

t R





1.67DW


A) DW dL Model kurma hatası yoktur

B) dL DW dU Model kurma hatası yoktur

C) 4dU DW dU Model kurma hatası yoktur



10) Aşağıdaki gibi verilmiş olan 2 model içerisinden hangisi niçin seçilecektir?

2

0 1 1 2 1

2 3

0 1 1 2 1 3 1

1.model:

2.model:

Y X X v

Y X X X e

A) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.

B) 1. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.

397

C) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlemektedir.

D) 2. Model seçilir, kalıntılar 0 etrafında rastgele bir dağılım izlememektedir.

E) 2. Model seçilir, X bağımsız değişkeni 0 etrafında rastgele bir dağılım izlemektedir.

Cevaplar

1) c

2) e

3) a

4) e

5) a

6) a

7) a

8) c

9) c

10) c

398

KAYNAKÇA

Ahmet Kılıçbay, “Ekonometrinin Temelleri”. İ.Ü. İktisat Fakültesi, İstanbul, 1980.

Davidson,R., MacKinnon,J.G. “Econometric Theory and Methods”, Oxford Univesity

Press, 2003.

Davidson,R., MacKinnon,J.G. “Estimation and Inference in Econometrics”, Oxford

Univesity Press, 1993.

Ebru Çağlayan, Selahattin Güriş, “Ekonometri Temel Kavramlar”, Der Yayınları, 2010.

Gujarati, D.N., “Basic Econometrics”, Mcgraw-Hill, New York, 2004.

Gujarati, D.N., “Essentials of Econometrics”, Mcgraw-Hill, New York, 1992.

Greene, W.H., “Econometric Analysis, Fifth Edition”, Prentice Hall, New Jersey,2003.

Hill, R.C., Griffiths, W.E., Lim, G.C., “Principles of Econometrics, Third Edition”,

Wiley,USA, 2007.

Hill, R.C.,Griffiths, W.E., Judge, G.G., ”Undergraduate Econometrics, Second Edition”

John Wiley and Sons Ltd, England, 2002.

Maddala, G.S., “Introduction to Econometrics, Third Edition”, John Wiley and Sons

Ltd, England, 2001.

Mustafa Tekin, Ebru Çağlayan ” Excel ile Temel Ekonometri “, Der Yayınları, 2003

Selahattin Güriş, Ebru Çağlayan, Burak Güriş, “EViews ile Temel Ekonometri” Der

Yayınları, 2011.

Documents

EKONOMETRİ - İstanbul Üniversitesiauzefkitap.istanbul.edu.tr/kitap/kok/ekonometriu159.pdf · 2020. 4. 17. · I . ÖNSÖZ. Ekonometri dersi, iktisat teorilerinin, uygulamada geçerliliğinin