Download pptx - Qualitative Response Model

Qualitative Response Model

被説明変数がダミー変数の回帰

• 例） MROZ.RAW• 女性労働– inlf 女性が外で働いていれば 1 ，そうでなけ

れば 0– inlf=f( 家計所得，教育年数，年齢，子育て費

用）• 推定方法–線型確率モデル (linear probability model)–プロビットモデル　 probit model–ロジットモデル　 logit model

線型確率モデル

iikkiii uxxxy ,,22,11

被説明変数 y は 1 または 0 の値をとるダミー変数線型モデルをそのまま当てはめる

y

1

0x

当てはめられた直線

y の予測値（当てはめられた直線）は，説明変数が特定の値をとるときに， y が1 となる確率を表すと解釈することができる係数 b は x の増加がy が 1 となる確率をどのくらい増加させるかを表す

線型確率モデルの問題点

• y の予測値が 0 と 1 の間に収まらない– Pr(y=1|x) のもっと良い定式化は ?– Pr(y=1|x)=F(b’x)– F( ) に確率分布関数を当てはめるとこの問題

は回避できる• 分散不均一性の問題

分布関数の当てはめ

probit model, logit model

*11)|1Pr( yFuxxFxy kk

)()( ** yyF

*

**

exp1exp)(

yyyF

次のようなモデルを想定　 F( ) は確率分布関数

Probit model 標準正規分布

Logit model 　 logisitic 分布

ただし， y*=’x+u

係数の意味probit model, logit model

)()(1)(10|E *** yFyFyFxy

j

jjj

yfxy

yyF

xyF

xxy )()()(|E *

*

*

**

f( ) は確率密度関数 , y*=’x+u

probit model や logit model での係数の解釈 y の期待値に与える影響を正確に求めるためには， f(y*) の計算が必要x1,x2,..,xk の水準に依存（他の説明変数がとる値によっても異なる）

Probit model, logit model の考え方

0if00if1

*

*

,,22,11*

i

ii

iikkiii

yy

y

uxxxy

ここで y は観察される変数であるが， y* は観察不可能な変数であるとする。また，誤差項はある確率分布にしたがう。例）　女性の労働参加を決定するある観察不可能な変数がある（ y* ）。観察不可能な変数 y* は，説明変数 x の線型関数 + 誤差項で決定される。y* がある閾値 (critical value) を超えると女性は労働に参加する (y=1) 。しかし， y* が閾値を越えなければ女性は労働に参加しない (y=0)

Probit model, logit model の考え方( 続き）

xFxFxu

uxy

1Pr

0Pr0Pr *

最後の等式は，確率密度関数が x=0 に関して対称的な場合に成立標準正規分布 , ロジスティック分布では成立

線形確率モデル

probit, logit モデルの推定menu から Quick Estimate equationを選択して，次の画面の Estimation settings 　で method に BINARYを選択する。

specification に Binary estimation method という option が表れるので， Probit または　Logit を選択する

Probit 　 model

係数の比較ols probit logitcoef s.e. coef s.e. coef s.e.

C 0.707 0.150 0.580 0.496 0.838 0.841

NWIFEINC -0.003 0.001 -0.012 0.005 -0.020 0.008

EDUC 0.040 0.007 0.134 0.025 0.227 0.043

EXPER 0.023 0.002 0.070 0.008 0.120 0.014

AGE -0.018 0.002 -0.056 0.008 -0.091 0.014

KIDSLT6 -0.272 0.034 -0.874 0.118 -1.439 0.201

KIDSGE6 0.013 0.013 0.035 0.043 0.058 0.073

Probit, Logit model の推定方法最尤法による推定

n

i

yi

yi

y yii

ii

i i

xbFxbF

xbFxbFL

1

1

0 1

1

'1

尤度関数 likelihood function

n

iiiii xbFyxbFyL

1

1ln)1(lnln

probit model, logit model 　： F( 　 ) を特定化し，最尤法でパラメータを決める

係数の意味　 : marginal effectprobit model, logit model

j

jjj

yfxy

yyF

xyF

xxy )()()(|E *

*

*

**

f( ) は確率密度関数 , y*=’x+u

)(1)()exp(1

1)exp(1

)exp()exp(1

)exp(

)exp(1)exp(1)exp()exp(1)exp(

)exp(1)exp()(

****

*

2*

*

2*

****

*

*

**

yFyFyy

yy

y

yyyyy

yy

yyf

logit model の場合

probit model の場合　 f(y*)=f(y*) 　標準正規分布の密度関数

係数の意味： marginal effect (2)

j

jjj

yfxy

yyF

xyF

xxy )()()(|E *

*

*

**

𝜕𝐸 [ 𝑦∨𝑥 ] /𝜕 𝑥 𝑖

𝜕𝐸 [ 𝑦∨𝑥 ]/𝜕 𝑥 𝑗=𝛽𝑖

𝛽 𝑗

probit model, logit model の係数の比は， marginal effect の相対的な比率を表す

vector prob_b = @coefsscalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * @mean(age) + prob_b(6) *@mean(kidslt6) + prob_b(7) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (7) dydxdydx(2) = dnorm_y * prob_b(2)dydx(3) = dnorm_y * prob_b(3)dydx(4) = dnorm_y * prob_b(4)dydx(5) = dnorm_y * prob_b(5)dydx(6) = dnorm_y * prob_b(6)dydx(7) = dnorm_y * prob_b(7)

marginal effect の求め方　　

説明直前の回帰の係数 @coefs をprob_b というベクトルに代入説明変数が平均値をとる場合のy* を計算し， yhat というスカラー変数に代入yhat の値での標準正規分布の密度関数の値を計算し，それをdnorm_y というスカラー変数に代入Marginal effects の結果を代入するベクトルを dydx とする（要素数は 7 個）各要素に，それぞれの説明変数の限界効果を代入

Eviews のコマンドウィンドウで次のようにタイプ

probit 分析の結果を開いたまま，View/ Representation とたどり，そこの結果を張り付けて編集すると楽

説明変数の平均値をここにコピーする（定数項は 1 とする）

係数の値

この列は B 列と C 列の掛け算

上のセルの合計

関数を使ってy* における密度関数の値を得る　norm.s.dist( , )

marginal effects

marginal effect の求め方　 Excel を用いた方法

問題 (1)

• MROZ.RAW のデータを用い，女性の労働参加を，線型確率モデルと logit model, probit model で推計し，係数を解釈せよ。–被説明変数：　 inlf 　労働力であれば 1–説明変数： nwifeinc( non wife income),

educ( 教育年数）， exper( 実際に働いた年数）， , age （年齢）， kidslt6 （ 6 歳未満の子供の数） , kidsge6 （ 6-18 歳の子供の数）

• logit model の場合の f(y*) は ?

問題 (2)• 問題 (1) の説明変数に expersq(exper の平

方）を加え， probit model および logit model で推計し， marginal effects を求めよ。

の場合，となることに注意

vector prob_b = @coefsscalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * ( @mean(exper ) )^2 + prob_b(6) * @mean(age) + prob_b(7) *@mean(kidslt6) + prob_b(8) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (8) dydxdydx(2) = dnorm_y * prob_b(2)dydx(3) = dnorm_y * prob_b(3)dydx(4) = dnorm_y * ( prob_b(4) + 2 * prob_b(5) * @mean(exper) )dydx(6) = dnorm_y * prob_b(6)dydx(7) = dnorm_y * prob_b(7)dydx(8) = dnorm_y * prob_b(8)

marginal effect の求め方　　

説明直前の回帰の係数 @coefs をprob_b というベクトルに代入説明変数が平均値をとる場合のy* を計算し， yhat というスカラー変数に代入Yhat の値での標準正規分布の密度関数の値を計算し，それをdnorm_y というスカラー変数に代入Marginal effects の結果を代入するベクトルを dydx とする（要素数は 8 個）各要素に，それぞれの説明変数の限界効果を代入

この例では， expersq というexper の平方の項があるため， dydx(4) の計算は他とは異なっている

Eviews のコマンドウィンドウで次のようにタイプ

probit 分析の結果を開いたまま，View/ Representation とたどり，そこの結果を張り付けると便利

説明変数の平均値をここにコピーする

係数の値

この列は B 列と C 列の掛け算

上のセルの合計

関数を使って y* における密度関数の値を得る

marginal effects

marginal effect の求め方　 Excel を用いた方法

Tobit model• 耐久財の購入量 (y) の決定

– 購入しない人 (y=0) が存在– y>0 と y=0 のみが観察される

• この場合も次のようなモデルを考える– y* 観察不可能な変数で，耐久財の購入量 (y) を決定する潜在変

数

0if00if

*

**

11*

yyy

y

uxxy kk

Tobit model の当てはめ

x

yOLS の当てはめ

y* と x の関係Tobit model

Tobit model の応用

• 女性の労働供給–MROZ.RAW–労働参加していない女性が一定割合存在

• 耐久財の購入• 低賃金労働者の労働供給–生活保護の受給との関係で

Tobit model の解釈

),0max(

,0~*

2

*

yy

Nu

uxy

xyx

xxuxuuxy

0Pr1Pr

Pr0Pr0Pr

Tobit model の解釈 (2)

f

f

xxxxx

xxx

xuuxxuuxyy

1

|E|E0|E

)(1

)(|Ec

cczz

f

ここで， z~N(0,1) のとき，次の式が成り立つことを用いている inverse Mills ratio

y>0 の条件付きの期待値は， xb よりも大きくなることが重要

Tobit model の解釈 (3)

f

xxxxxx

yyyyy

0Pr00Pr0|EE

y の unconditional expected value

説明変数 x が与えられた場合のｙの期待値

y>0 の条件付き期待値は前頁

Tobit モデルの解釈 (4)

jj

jj

xyx

xyx

f

E

0Pr

結果だけまとめておく

Tobit の推定方法

menu で　 Quick Estimate equation

Estimation settingsの method で　CENSORED - ..を選択する

誤差項の分布を選択（ Tobit は正規分布）

打ち切りの位置を指定する。 0以外の値も，右側の指定もできる。

E-Views での Tobit modelの推定

s の推計値

Dependent var hours

　 Tobit 　 OLS 　

　 Coef s.e. Coef s.e.

C 965.31 446.44 1330.48 270.78

NWIFEINC -8.81 4.46 -3.45 2.54 EDUC 80.65 21.58 28.76 12.95

EXPER 131.56 17.28 65.67 9.96

EXPERSQ -1.86 0.54 -0.70 0.32 AGE -54.41 7.42 -30.51 4.36

KIDSLT6-

894.02

111.88 -442.09 58.85

KIDSGE6 -16.22 38.64 -32.78 23.18

1122.02 750.179

Tobit model と OLS の比較

E-Views での出力Tobit の場合， xj の 1 単位の増加y の期待値に与える影響をみるためには， x’b/s を計算し，標準正規分布関数からその涙液分布を計算する必要あり。単純に比較できない

問題 (3)

• MROZ.RAW• 女性の労働時間の回帰分析– 40% 強が労働時間 0–被説明変数： hours–説明変数： nwifeinc, educ, exper, exper^2,

age, kidslt6,kidsge6– OLS と Tobit model で推計し，結果を解釈せ

よ