Upload
others
View
23
Download
0
Embed Size (px)
Citation preview
Bağımlı Kukla Değişkenler
1
•Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin
varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla
değişkenler söz konusudur.
•Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır:
-Doğrusal Olasılık Modeli
-Logit Modeli
-Probit Modeli
-Tobit Modeli
Doğrusal Olasılık Modeli
2
Yi = b1 + b2Xi +ui
Yi= 1 Eğer i. Birey istenen özelliğe sahipse
0 Diğer Durumlarda
Xi= Bağımsız değişken
Bu modele olasılıklı model denmesinin nedeni, Y’nin X için şartlı
beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır.
E(Yi|Xi)=Pr(Yi=1| Xi)
Doğrusal Olasılık Modeli
3
E(Yi |Xi)= b1 + b2XiE(ui) = 0
Yi değişkeninin olasılık dağılımı:
Yi Olasılık
0 1-Pi
1 Pi
Toplam 1
E(Yi |Xi) = SYiPi=0.(1-Pi) + 1.(Pi) = Pi
E(Yi |Xi)= b1 + b2Xi
= Pi
0 E(Yi |Xi) 1
DOM Tahminindeki Sorunlar
4
ui hata teriminin normal dağılmayışı:
•Normallik varsayımının sağlanmaması durumunda tahmin
ediciler sapmasızlıklarını korurlar.
•Nokta tahminde normallik varsayımı gözardı edilir.
•Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla
normal dağılıma uyarlar
•DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı
altındaki EKK sürecine uyarlar
u’ların Binom Dağılımlı Olması
EKKY varsayımlarından biri u değerlerinin dağılımının normal
olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven
aralıkları hesaplanıp, test yapılabilmektedir.
DOM’de u’lar normal dağılmaz, binom dağılımı gösterir:
1 2i iu Y b b X
1 2i iY b b X u
Y 1 ve 0 değerini aldığında
Yi =1 için 1 21i iu b b X
Yi =0 için 1 2i iu b b X
u lar normal değildir. İki değerli binom dağılımlıdır. Ancak
büyük örneklerde DOM güven aralıkları ve hipotez testleri
geçerlidir ve EKKY normal dağılım varsayımının sağlandığı
kabul edilmektedir.5
Yi ui İhtimal=P(ui)
0 -b1-b2X (1-Pi)
1 1-b1-b2X Pi
2 2
i 1 2 i 1 2 iVar(u ) ( b b X) (1 P ) (1 b b X) (P )
i 1 2 1 2Var(u ) (b b X)(1 b b X)
ui hata teriminin değişen varyanslı olması:
)(.)()( 2
ii YPYYYVar
DOM’de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y
değişkeni varyansından hareketle
Y yerine u alınarak
)(.)()(.)()( 22
ii uPuuPuuuVar
i i i i iVar(u ) E(Y | X )[1 E(Y | X )] P (1 P ) 6
u’nun varyansı farklıdır. u’nun varyansı Y’nin X için şartlı
beklenen değerine bağlıdır ve sonuçta u’nun varyansı X’in
değerine bağlı olacak ve eşit olmayacaktır.
DOM’nin EKKY ile tahmininde ortaya çıkan farklı varyans
problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm
getirmek mümkündür:
1 2 i i
i i i i
b b X uY
v v v v
i i i i iv E(Y | X )[1 E(Y | X )] P (1 P )
ui hata teriminin değişen varyanslı olması:
•Var(ui) = Pi(1-Pi)
7
DOM’de Farklı Varyansı Önleme
i i iˆ ˆv Y (1 Y )
iE(Y | X ) ler bilinmediğinden bunun yerine örnek tahmini ˆiY
değerleri hesaplanarak ifadesinde yerine
konur.
0 E(Yi |Xi) 1 varsayımının yerine gelmeyişi
DOM’de Y’nin şartlı olasılığını gösteren E(Y|X) nın 0 ila 1
arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.Bu şart
anakütle için geçerlidir. Anakütlenin tahmincisi için geçerli
olmayabilir.
Tahmini şartlı olasılıklar 0 ile 1 olmayabilir:
ˆiY
8
0 E(Yi |Xi) 1
0 ile 1 arasında mıdır? DOM”, EKKY ile elde edildikten sonra:
ˆiY
eşit olduğu kabul edilir.
1- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için ˆiY
0 değerini alır. 1’den büyük değerli ise bunlar için nin 1’e
9
ˆiY
0.999 değeri verilir.
2- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için ˆiY
0.001 değerini alır. 1’den büyük değerli ise bunlar için ne
10
u
veşit varyanslıdır. Bu yöntem Tartılı En Küçük Kareler
Yöntemi (TEKKY) olarak adlandırılır.
Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın
kalktığı görülebilir.
3- Bunlardan bir kısmı 0 dan küçük, negatif değerli ve 1’den büyük
değerli ise bu gözlemler atılır.
11
R2 Değerinin Genellikle Küçük Çıkarak, İlişkinin
Uyumunu Gösteren Bir Ölçü Olamaması
Belli bir X’e karşılık gelen Y, ya 0 ya da 1’dir. Öyleyse bütün Y
değerleri, ya X ekseni ya da 1’in hizasındaki doğru üzerinde yer
alır. Genellikle klasik En Küçük Kareler yöntemi ile hesaplanan
R2 , böyle modellerde 1’den çok küçük çıkma eğilimindedir.
Çoğu uygulamada R2 , 0.2 ile 0.6 arasında yer alır. Tahmin edilen
Yi , ya 0’a ya da 1’e yakın çıkacaktır.
Bu nedenle John Aldrich ile Forrest Nelson ‘Nitel bağımlı
değişkeni olan modellerde, belirlilik katsayısının bir özetleme
istatistiği olarak kullanılmasından kaçınılması gerektiğini ileri
sürmektedir (Gujarati, 1995:546).
Doğrusal Olasılık Modeli
12
Di = b1 + b2Mi +b3 Si +ui
Di= 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa
0 Diğer Durumlarda
Mi= 1 Eğer i. Kadın evliyse ve diğer durumlarda 0
Si = i.kadının yıl olarak aldığı eğitim
Di Mi Si Di Mi Si
1 0 16 1 0 10
1 1 14 1 1 14
1 1 16 0 1 10
0 0 9 0 1 12
1 0 12 1 0 13
0 1 12 1 0 14
1 0 14 1 1 12
1 0 10 0 1 7
0 0 12 0 1 11
1 0 8 0 1 12
1 0 11 1 1 10
1 0 14 1 0 15
0 1 12 0 1 10
1 1 13 0 1 11
0 1 9 1 1 12
Kadının İşgücüne Katılımı
Modeli:
Di= 1 i.Kadının bir işi varsa
ya da iş arıyorsa
0 Diğer Durumlarda
Mi= 1 i. Kadın evliyse
0 diğer durumlarda
Si = i.kadının yıl olarak aldığı eğitim
13
Kadının İşgücüne Katılımı Modeli
14
Di = b1 + b2Mi +b3 Si +ui
Dependent Variable: DI
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
C -0.284301 0.435743 -0.652452 0.5196
MI -0.381780 0.153053 -2.494430 0.0190
SI 0.093012 0.034598 2.688402 0.0121
R-squared 0.363455 Mean dependent var 0.600000
Adjusted R-squared 0.316304 S.D. dependent var 0.498273
S.E. of regression 0.412001 Akaike info criterion 1.159060
Sum squared resid 4.583121 Schwarz criterion 1.299179
Log likelihood -14.38590 F-statistic 7.708257
Durbin-Watson stat 2.550725 Prob(F-statistic) 0.002247
Mi= 1 Kadın evliyse ;0 diğer durumlarda ;
Si = i.kadının yıl olarak aldığı eğitim
15
Daha sonra modelde değişen varyans olup olmadığı araştırılmak istenmiş ve White testi
ile modelde değişen varyans problemi test edilmiştir.
White Heteroskedasticity Test:
F-statistic 1.759076 Probability 0.138742
Obs*R-squared 6.589061 Probability 0.143265
Prob değeri 0.143265>0.05 olduğu için H0 hipotezi olan Değişen varyans
yoktur, eşit varyans vardır hipotezi red edilemez. Test sonucu değişen
varyans problemi ile karşılaşılmadığından herhangi bir işlem yapılmaz.
Model olduğu gibi kabul edilir.
UYGULAMA:Akıllı telefonunun kullanılıp kullanılmamasını ifade eden bağımlı
kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile
açıklanmıştır.(Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse)
Kişi Y X(Gelir) Z(Yaş) Kişi Y X(Gelir) Z(Yaş)1 1 250 23 26 0 185 21
2 1 350 21 27 1 250 21
3 0 150 23 28 1 500 21
4 1 600 22 29 1 790 23
5 1 200 22 30 1 500 22
6 0 150 20 31 1 675 22
7 1 390 27 32 1 490 22
8 0 200 18 33 1 500 21
9 0 900 25 34 1 760 21
10 0 150 18 35 1 550 26
11 0 255 18 36 1 400 24
12 0 300 20 37 1 200 21
13 1 640 25 38 0 220 21
14 1 500 27 39 1 175 23
15 1 300 22 40 1 840 21
16 0 550 19 41 1 150 23
17 1 800 18 42 1 200 23
18 1 875 21 43 1 200 23
19 0 600 17 44 1 485 23
20 0 500 20 45 1 250 21
21 0 500 19 46 1 300 20
22 1 500 21 47 1 470 19
23 1 550 22 48 1 800 23
24 1 750 21 49 0 250 21
25 1 225 23 50 0 130 23
16
Dependent Variable: Y
Method: Least Squares
Included observations: 50
Variable Coefficient Std. Error t-Statistic Prob.
C -1.373086 0.585035 -2.347017 0.0232
X 0.000492 0.000259 1.900372 0.0635
Z 0.086130 0.026781 3.216041 0.0024
R-squared 0.2401 Mean dependent var 0.700
Adjusted R-squared 0.207770 S.D. dependent var 0.462910
S.E. of regression 0.412024 Akaike info criterion 1.122653
Sum squared resid 7.978889 Schwarz criterion 1.2373
Log likelihood -25.06633 F-statistic 7.425357
Durbin-Watson stat 1.552777 Prob(F-statistic) 0.001577
Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse; X(Gelir); Z(Yaş)
17
Önce Modelde değişen varyansın olup olmadığı White testi
ile araştırılır.
18
White Heteroskedasticity Test:
F-statistic 2.305076 Probability 0.010504
Obs*R-squared 10.37848 Probability 0.01195
1. Prob değeri 0.01195<0.05 olduğu için H0 hipotezi olan
Değişen varyans yoktur, eşit varyans vardır hipotezi red
edilir. Değişen varyans problemi ile karşılaşıldığından
önce hesaplanır.
2. ‘nin 0’dan küçük değerleri ve 1’den büyük değerleri veri
setinden çıkartılır..
3. Ardından hesaplanır.
4. Y= b1 + b2 X + b3 Z modelinin her iki tarafı da
değerine bölünür.
5. Model tahmin edilir.
vi
Y
Y
i i iˆ ˆv Y (1 Y )
Kişi Kişi Kişi Kişi
1 0.7308 16 0.5338 31 0.8536 46 0.4970
2 0.6077 17 0.5705 32 0.7627 47 0.4944
3 0.6817 18 0.8658 33 0.6815 48 1.0012
4 0.8167 19 0.3861 34 0.8093 49 0.5586
5 0.6201 20 0.5953 35 1.1367 50 0.6718
6 0.4233 21 0.5092 36 0.8907
7 1.1442 22 0.6815 37 0.5340
8 0.2756 23 0.7922 38 0.5438
9 1.2226 24 0.8044 39 0.6939
10 0.2510 25 0.7185 40 0.8486
11 0.3026 26 0.5266 41 0.6817
12 0.4970 27 0.5586 42 0.7062
13 1.0948 28 0.6815 43 0.7062
14 1.1982 29 0.9963 44 0.8463
15 0.6693 30 0.7676 45 0.5586
Y
Y
Y
Y
19
Dependent Variable:
Method: Least Squares
Sample: 1 50
Included observations: 44
Excluded observations: 6
Variable Coefficient Std. Error t-Statistic Prob.
-1.960127 0.591996 -3.311048 0.0019
0.000468 0.000170 2.754280 0.0087
0.114551 0.028194 4.062939 0.0002
R-squared 0.899751 Mean dependent var 1.9024
Adjusted R-squared 0.894861 S.D. dependent var 2.504969
S.E. of regression 0.812241 Akaike info criterion2.487706
Sum squared resid 27.04915 Schwarz criterion 2.609356
Log likelihood -51.72954 F-statistic 183.9907
Durbin-Watson stat 1.728717 Prob(F-statistic) 0.000000
1/ v
Y / v
X / v
Z/ v
20
21
Örnek büyüklüğü arttıkça hata terimi normal dağılıma
yaklaşsa ve değişen varyans durumunda, ağırlıklı en küçük
kareler yöntemi kullanılsa, modelin her iki tarafı ye
bölünüp model değişimi yapılsa bile normallik ve değişen
varyans varsayımlarıyla ilgili sakıncaları giderebilmek için
logit ve probit modeller geliştirilmiştir. Bu modeller, hem
şartını sağlayabilmekte ve hem de Pi
ile Xi arasındaki ilişkiyi doğrusallıktan kurtarabilmektedirler.
Yani, logit ve probit modelleri, farklı bağımsız X
değişkeninin olasılığının 0 ile 1 arasında kalmasını
sağladıkları gibi; ayrıca, değişik bağımsız değişkene ait belli
bir artış karşısında, bu bağımsız değişkenin kullanılma
olasılığının değişik miktarda artmasını sağlamaktadırlar.
vi
1)(0 ii XYE
DOM’e Alternatif Model Arama
DOM’e Alternatif Model Arama
22
Günümüzde nitel değişkenlerden oluşan kukla değişken
verileri analiz etmek için çeşitli teknikler kullanılmaktadır.
Bunlardan log-linear modeller iki veya daha fazla kukla
değişkenin koşullu ilişkisini analiz etmek için geliştirilmiştir.
Bununla birlikte, log-linear modeller sayesinde, değişkenlerin
oluşturduğu bileşik dağılımı, iki veya daha fazla değişkenin
birbirine bağımlı olup olmadığını ve iki veya daha fazla
değişken arasındaki ilişkiyi neden-sonuç ilişkisine
dayandırmaksızın test etmek mümkündür.
DOM’e Alternatif Model Arama
23
•DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir
•Ancak, DOM, Pi=E(Y=1|X) olasılığının X’le doğrusal olarak
arttığını varsayar. Yani X’deki marjinal veya küçük bir artış
hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir.
•DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir:
1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına
çıkmaması gerekmektedir.
2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması gerekmektedir.
DOM’e Alternatif Model Arama
24
Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir:
0
1P
- +X
KDF
•Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir.
•Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde
kullanılabilir.
Logit Model
25
Logit modeller, genelleştirilmiş doğrusal modelin belirli
koşullar altında oluşturulmuş özel durumlarıdır. Bu durumda,
eğer bağımsız değişkenlerin bazısı sürekli veya uygun (ilgili)
sınıflar içine ayrıştırılamazsa, o zaman log-linear analiz yerine
logistik regresyon kullanılmalıdır. Aynı zamanda eğer
değişkenlerin bazısı bağımlı olarak ele alınırsa, o zaman logit
model uygundur. Böyle bir durumda 0’la 1 arasında kalma
koşulunu sağlayabilmek için logit modelin uygulanması
önerilmektedir. Logit model, bağımlı değişkenin tahmini
değerlerini olasılık olarak hesaplayarak olasılık kurallarına
uygun sınıflama yapma imkanı veren, tablolaştırılmış ya da
ham veri setlerini analiz eden bir istatistiksel yöntemdir.
Logit Model
26
Logistik Dağılım Fonksiyonu
i
i
P 1 1.
1-P 1
zz
z z
ee
e e
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
1
1 iZe
kümülatif lojistik dağılım fonksiyonudur.
Bahis yada olabilirlik oranı
1 2i iZ b b X
ln( ) ln1
izii e
i
PL e
P
1 1 11 1
1 1 1
i i
i i i
Z Z
Z Z Z
e eP
e e e
Bu orana lehine fark oranı denir. Lojistik modelin her iki tarafının
doğal log. alındığında
Li fark oranı logaritması olup hem X, hem parametrelere göre
doğrusaldır.Z değişkeni - dan + a değişirken, P 0 ile 1
arasında değişir.
Logit Model
27
i 1 2P =E(Y=1|X) ib b X
DOM’de
şeklindedir.
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
1
1 iZe
Logit modelde olasılık
iken.
Logit Modelin Özellikleri
28
1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -ile + arasında değer
alır.
2. Logit, X’e göre doğrusal iken olasılıklara göre değildir.
3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız
değişkendeki bir birimlik değişme karşısında logitteki değişmeyi
gösterir.
4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli
bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.
2
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Z
Ze
ZFp
1
1)(
)(ZF
XZ 21
Bir olayın gerçekleşme olasılığının birden büyük olması
durumundan kaçınmak için olasılığın Z’nin S şeklinde bir
fonksiyonu olduğunu varsaymaktır. Z açıklayıcı değişkenlerin
fonksiyonu olarak ifade edilebilir.
Logit Model
29
3
0.00
0.25
0.50
0.75
1.00
-8 -6 -4 -2 0 2 4 6
Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve
yukarıda gösterildiği gibi bunlardan biri de lojistik
fonksiyondur. Z + sonsuza gideren, e-Z sıfıra gitmekte, ve p 1’e
gitmektedir. (fakat 1’i geçmemektedir.). Z – sonsuza giderken,
e-Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın
altına inmemektedir.).
XZ 21
)(ZFZ
eZFp
1
1)(
Z
Logit Model
30
A- Frekanslı Serilerde Logit Modelin EKKY İle Tahmini
1.Adım: ihtimalleri (nispi frekanslar)
hesaplanır.i i iP n N
2.Adım: fark oranı logaritmaları hesaplanır.i i iL ln(P 1 P )
3.Adım: orijinal lojistik modeli tahminlenir.i 1 2 i iL b b X u
i i i iL ln[n (N n )]
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her
iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.iv
i 1 2 i iL b b X u i i i iv N P (1 P ) 31
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her
iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.iv
i i 1 i 2 i i i iv L b v b v X v u
* *
1 i 2 i iL b v b X w Dönüşümlü veya Tartılı
EKK Lojistik Modeli
i i i iv N P (1 P )
i i iw u v32
Frekanslı Seri İçin Logit Model Uygulaması
300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (Xi)
ve ev sahibi olanların sayısı (ni) aşağıdaki tabloda gösterilmiştir.
X
Milyon TL)
Aile Sayısı=
Ni
Ev Sahibi
Olan Aile
Sayısı=ni
Nispi
Frekanslar
Pi=ni/Ni
12 20 5 0.25
16 25 6 0.24
20 35 10 0.28
26 45 15 0.33
30 50 25 0.50
40 34 18 0.53
50 30 20 0.66
60 26 16 0.61
70 20 15 0.75
80 15 10 0.67
SNi = 300 Sni = 14033
Xi
1
12
16
20
26
30
40
50
60
70
80
Ni
2
20
25
35
45
50
34
30
26
20
15
ni
3
5
6
10
15
25
18
20
16
15
10
Pi
4=3/2
0.25
0.24
0.28
0.33
0.50
0.53
0.66
0.61
0.75
0.67
1-Pi
5=1-4
0.75
0.76
0.72
0.67
0.50
0.47
0.34
0.39
0.25
0.33
Pi /1- Pi
6=4/5
0.33
0.31
0.39
0.49
1.00
1.13
1.94
1.56
3.00
2.03
Li
7=ln(6)
-1.1086
-1.1712
-0.9416
-0.7133
0.0000
0.1222
0.6626
0.4446
1.0986
0.7080 34
Dependent Variable: L
Method: Least Squares
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -1.409706 0.215776 -6.533192 0.0002
X 0.032669 0.004667 7.000011 0.0001
R-squared 0.859649 Mean dependent var -0.089870
Adjusted R-squared 0.842106 S.D. dependent var 0.835010
S.E. of regression 0.331799 Akaike info criterion 0.808280
Sum squared resid 0.880723 Schwarz criterion 0.868797
Log likelihood -2.041402 F-statistic 49.00015
Durbin-Watson stat 1 .582165 Prob(F-statistic) 0.00011335
v=N.P.(1-P)
8=2.4.5
3.75
4.56
7.05
9.95
12.50
8.47
6.73
6.18
3.75
3.31
vi
9= 8
1.9365
2.1354
2.6552
3.1543
3.5355
2.9103
2.5942
2.4859
1.9365
1.8193
L*
10=7.9
-2.1468
-2.5009
-2.5001
-2.4999
0.0000
0.3556
1.7189
1.1052
2.1274
1.2880
X*
11=1.9
23.2379
34.1666
53.1036
82.0134
106.0660
116.4130
129.7112
149.1576
135.5544
145.5472 36
Li*= -1.38056 vi + 0.03363 Xi
*, s= 0.8421
s(bi): (0.2315) (0.00556) , R2= 0.80
t= (-5.9617) (6.0424) , d= 1.649, F= 36.95
Gelir bir birim arttığında, ev sahibi olma lehine fark
oranının logaritması 0.033 artmaktadır. Bu fark oranına göre
belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir:
X=40 iken 2.9103iv 116.4130X
değerleri yukarıdaki denklemde yerine konduğunda
L*=-0.10288 bulunur.
*ˆ
ˆlog log log( 0.10288) 0.9022ˆ1
PAnti L Anti Anti
P
ˆ0.9022
ˆ1
P
P
ˆ 0.4743P olabilirlik oranı37
40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43’dür.
Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik
artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin
edilebilir:
2ˆ ˆ ˆ(1 )b P P
formülünden yararlanılır. X=40 iken gelir 1 birim arttığında
ev sahibi olma olasılığı
[0.03363(1-0.4743)0.4743]=0.00838(%0.8)
38
B- En Yüksek Olabilirlik Yöntemiyle Logit Modelin Elde Edilmesi
39
Frekanslı olmayan serilerde logit modeli EKKY ile çözülemez.
ln( ) ln1
izii e i
i
PL e Z
P
Pi=1 ve Pi=0 değerleri logit Li’ deki yerine koyulduğunda ln(1/0)ve ln(0/1) değerleri elde edilir ki bunlar anlamsızdır. En küçükkareler yöntemi ile L fonksiyonundaki parametrelerin tahmindeğerleri bulunamaz, fakat bu parametreler maksimum olabilirlikmodeli ile tahmin edilebilir.
• Örneğin aşağıda frekanslı olmayan bir serinin en yüksekolabilirlik yöntemi ile logit model tahmini yer almaktadır:
40
41
Modeldeki katsayılar aşağıdaki gibidir;
• Logit modelde katsayılar doğrudan, bağımsızdeğişkenlerdeki bir değişimin bağımlı değişkeninbeklenen değeri üzerindeki etkisi olarakyorumlanamamaktadır.
• Katsayının işareti bağımsız değişken ile olayıngerçekleşme olasılığı arasındaki ilişkinin yönünügösterir.
• Modeldeki bağımsız değişkenlerin tümü olayıngerçekleşme olasılığı ile ters yönlü bir ilişkiiçerisindedir.
42
43
44
1 2 ii (b b X )
1P =E(Y=1|X)
1 e
45
46
47
48
Probit Model
Probit model, y bağımlı değişkenin normaldağıldığını varsayarken, Logit model bu değişkeninlojistik eğriye dayandığını varsaymaktadır.
Bu iki modelden Logit modelin dağılımda lojistikbirikimli dağılım fonksiyonunun kuyruk bölgeleriProbit modele göre daha geniştir.
Nitel olarak ele alındığında bu iki model benzersonuçlar vermesine rağmen iki modelin tahminedilen anakütle katsayılarını doğrudankarşılaştırmak mümkün değildir.
49
İki değer alabilen nitel değişkenli nitel tercihmodellerinden biri olan DOM’ndeki en belirginsorun, tahmin edilen olasılık değerlerinin 0-1aralığının dışına çıkması sorunudur. Bu sorunungiderilmesi adına kullanılan Probit model,olasılıkların 0-1 arasında kalmasını sağlayan vekatsayılar itibariyle doğrusal olmayan birmodeldir.
Probit model, genellikle gözlenemeyen bir faydaendeksi ile oluşturulduğundan, fayda endeksihakkında bilgi verme yükümlülüğünü taşımaktadır.
50
Bağımlı kukla değişkenli modellerden kümülatif lojistik
fonksiyonundan farklı olarak, normal kümülatif dağılım
fonksiyonunu kullanan PROBİT(NORMAL) Model aşağıdaki
gibi formüle edilir:
1
2
02 22
Z Ze z( ) /
F(z)=
P R O B İ T (NORMAL) MODEL
Probit modeli şu şekilde tanımlayabiliriz:
Herhangi bir i hanesinin ev sahibi olma veya olmama
kararının gözlenemeyen bir fayda indeksi Ii’ye bağlı
olduğunu varsayalım.
51
Ii* Ii ifadesi faydanın belli bir eşik değerinden sonra söz konusu
olabileceğini gösterir. Ii* başlangıç değeri de Ii gibi gözlenemez.
Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak Ii
değerleri yukarıdaki regresyon denkleminden tahmin edilir.
Tahminciler bulunur.
Normal dağılım varsayımıyla Ii* ın Ii den küçük veya eşit olma
olasılığı aşağıdaki standartlaştırılmış normal KDF ile
hesaplanabilir:
Ii= b1 + b2 Xi
Ii, bağımsız değişkenlere bağlıdır. Örneğin Xi (gelir)değişkeni.
Her hane için Ii’nın belli bir değerinden itibaren ev sahibi olma
durumu söz konusudur.Ii değeri, Ii* değerini aştığı zaman hane, ev
sahibi olacak aksi durumda olmayacaktır.
Y=1 hane ev sahibi
Y=0 hane ev sahibi değil.
(1)
52
53
Endeks değerinin kendisi gibi gözlenemeyen ve Ii* ile ifade
edilen eşik değerine sahip olduğu düşünüldüğünde, eğer Ii
değeri Ii* değerini aşarsa olayın meydana gelmeyeceği
söylenebilir.
Ii* değerinin Ii değerinden küçük ya da Ii‘ye eşit olması
normallik varsayımı altında standartlaştırılmış birikimlidağılım fonksiyonlarından hareketle hesaplanmaktadır.Burada Ii gerçekte ölçülmemiş bir endeks olup normal vesürekli bir tesadüfi değişken olarak adlandırılabilir.
Ii‘ler için gözlemler mevcut değildir. Ancak bu endeksin küçükve büyük değerlerinden bireysel gözlemlerin hangi kategoriyeait oldukları bilinmektedir.
i 2I2/t dte
2
1 1
2
2 21 2
e dttb b Xi
/
=Standartlaştırılmış Normal KDF
Pi=Pr(Y=1)=Pr(Ii* Ii)=F(Ii)
)1,0(Nt =standartlaştırılmış normal değişken
Pi=Bir ev sahibi olma olasılığı.
(2)
54
Probit Model
55
0
1
Pi=F(Ii)
- +
0
1
Pi=F(Ii)
- +
Pi
Ii= b1 + b2 Xi
Pi
Ii=F-1(Pi )
Ii* <=Ii verilmişken ev sahibi olma
olasılığı Pi ordinatta bulunur
Pi verilmişken, absiste Ii bulunur.
Ii’yı bulabilmek için 2 no’lu ifadenin tersi alınmalıdır.
Ii = F-1(Ii)= F-1 (Pi)=b1+b2Xi
=Probit model
F-1: normal kümülatif dağılım fonksiyonunun tersi.
56
57
A- Frekanslı Serilerde Probit Modelin Tahmin Aşamaları
58
1. Pi= ni/Ni hesaplanır.
2. Ii = F-1 (Pi)= normal eşdeğer sapma bulunur.
3. Ii = b1 + b2 Xi + ui EKK ile tahmin edilir.
4. İstenirse, Ii yerine, (Ii + 5)=probit değerleri alınarak, EKKY ile
(13.19) tahmin edilir.
5. modelinin hata terimi ui farklı varyanslıdır. Bu sebepten
dönüşümlü değerler alınarak TEKKY uygulanabilir:
2
u
P P
N f
i i
i i
( )1fi= F-1 (Pi) ifadesine eşit standart normal
yoğunluk fonksiyonudur.
6. Büyük örnekler için bi'lerin güven aralıkları ve hipotez testleri
uygulanarak, anakütlede durumun geçerliliği araştırılabilir.
7. Belirlilik katsayısı R2, modelin fonksiyonel biçiminin iyi seçilip
seçilmediği konusunda bize fikir vermez.
59
Probit Model Uygulaması
60
Pi
0.25
0.24
0.28
0.33
0.50
0.53
0.66
0.61
0.75
0.67
Ii=F-1(Pi)
-0.6745
-0.7063
-0.5828
-0.4399
0.0000
0.0752
0.4124
0.2793
0.6745
0.4399
Probitler=Zi=(Ii+5)
4.3255
4.2937
4.4172
4.5601
5.0000
5.0752
5.4124
5.2793
5.6745
5.4399
Xi
12
16
20
26
30
40
50
60
70
80
Probit Model Uygulaması
61
Ii= -0.8587 + 0.0200 Xi , r2= 0.8628 r= 0.9289
s(bi) (0.0028) s= 0.2 d= 1.59
t= (7.094)
Zi= 4.1324 + 0.0201 Xi , r2= 0.8621 r= 0.9285
s(bi) (0.0028) s= 0.2 d= 1.5637
t= (7.071)
B- En Yüksek Olabilirlik Yöntemiyle Probit Modelin Elde Edilmesi
62
En Yüksek Olabilirlik Yöntemi’nde anakütle ve bu anakütledençekilen örnek arasındaki benzerlik ilişkisinden yararlanılarakbu örneğin elde edilme olasılığını maksimum yapan parametredeğerleri tahmin edilmektedir.
En Yüksek Olabilirlik Yöntemi, benzerlik fonksiyonununmaksimizasyonundan oluşmaktadır. Bu yönteminuygulanabilmesi için hata terimlerinin dağılımının bilinmesigereklidir.
Logit modelin en yüksek olabilirlik yöntemiyle elde edilenörneğin probit model uygulaması şu şekilde gerçekleşmiştir:
63
64
65
66
67