Qualitative Response Model
被説明変数がダミー変数の回帰
• 例) MROZ.RAW• 女性労働– inlf 女性が外で働いていれば 1 ,そうでなけ
れば 0– inlf=f( 家計所得,教育年数,年齢,子育て費
用)• 推定方法–線型確率モデル (linear probability model)–プロビットモデル probit model–ロジットモデル logit model
線型確率モデル
iikkiii uxxxy ,,22,11
被説明変数 y は 1 または 0 の値をとるダミー変数線型モデルをそのまま当てはめる
y
1
0x
当てはめられた直線
y の予測値(当てはめられた直線)は,説明変数が特定の値をとるときに, y が1 となる確率を表すと解釈することができる係数 b は x の増加がy が 1 となる確率をどのくらい増加させるかを表す
線型確率モデルの問題点
• y の予測値が 0 と 1 の間に収まらない– Pr(y=1|x) のもっと良い定式化は ?– Pr(y=1|x)=F(b’x)– F( ) に確率分布関数を当てはめるとこの問題
は回避できる• 分散不均一性の問題
分布関数の当てはめ
probit model, logit model
*11)|1Pr( yFuxxFxy kk
)()( ** yyF
*
**
exp1exp)(
yyyF
次のようなモデルを想定 F( ) は確率分布関数
Probit model 標準正規分布
Logit model logisitic 分布
ただし, y*=’x+u
係数の意味probit model, logit model
)()(1)(10|E *** yFyFyFxy
j
jjj
yfxy
yyF
xyF
xxy )()()(|E *
*
*
**
f( ) は確率密度関数 , y*=’x+u
probit model や logit model での係数の解釈 y の期待値に与える影響を正確に求めるためには, f(y*) の計算が必要x1,x2,..,xk の水準に依存 (他の説明変数がとる値によっても異なる)
Probit model, logit model の考え方
0if00if1
*
*
,,22,11*
i
ii
iikkiii
yy
y
uxxxy
ここで y は観察される変数であるが, y* は観察不可能な変数であるとする。また,誤差項はある確率分布にしたがう。例) 女性の労働参加を決定するある観察不可能な変数がある( y* )。観察不可能な変数 y* は,説明変数 x の線型関数 + 誤差項で決定される。y* がある閾値 (critical value) を超えると女性は労働に参加する (y=1) 。しかし, y* が閾値を越えなければ女性は労働に参加しない (y=0)
Probit model, logit model の考え方( 続き)
xFxFxu
uxy
1Pr
0Pr0Pr *
最後の等式は,確率密度関数が x=0 に関して対称的な場合に成立 標準正規分布 , ロジスティック分布では成立
線形確率モデル
probit, logit モデルの推定menu から Quick Estimate equationを選択して,次の画面の Estimation settings で method に BINARYを選択する。
specification に Binary estimation method という option が表れるので, Probit または Logit を選択する
Probit model
係数の比較ols probit logitcoef s.e. coef s.e. coef s.e.
C 0.707 0.150 0.580 0.496 0.838 0.841
NWIFEINC -0.003 0.001 -0.012 0.005 -0.020 0.008
EDUC 0.040 0.007 0.134 0.025 0.227 0.043
EXPER 0.023 0.002 0.070 0.008 0.120 0.014
AGE -0.018 0.002 -0.056 0.008 -0.091 0.014
KIDSLT6 -0.272 0.034 -0.874 0.118 -1.439 0.201
KIDSGE6 0.013 0.013 0.035 0.043 0.058 0.073
Probit, Logit model の推定方法最尤法による推定
n
i
yi
yi
y yii
ii
i i
xbFxbF
xbFxbFL
1
1
0 1
1
'1
尤度関数 likelihood function
n
iiiii xbFyxbFyL
1
1ln)1(lnln
probit model, logit model : F( ) を特定化し,最尤法でパラメータを決める
係数の意味 : marginal effectprobit model, logit model
j
jjj
yfxy
yyF
xyF
xxy )()()(|E *
*
*
**
f( ) は確率密度関数 , y*=’x+u
)(1)()exp(1
1)exp(1
)exp()exp(1
)exp(
)exp(1)exp(1)exp()exp(1)exp(
)exp(1)exp()(
****
*
2*
*
2*
****
*
*
**
yFyFyy
yy
y
yyyyy
yy
yyf
logit model の場合
probit model の場合 f(y*)=f(y*) 標準正規分布の密度関数
係数の意味: marginal effect (2)
j
jjj
yfxy
yyF
xyF
xxy )()()(|E *
*
*
**
𝜕𝐸 [ 𝑦∨𝑥 ] /𝜕 𝑥 𝑖
𝜕𝐸 [ 𝑦∨𝑥 ]/𝜕 𝑥 𝑗=𝛽𝑖
𝛽 𝑗
probit model, logit model の係数の比は, marginal effect の相対的な比率を表す
vector prob_b = @coefsscalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * @mean(age) + prob_b(6) *@mean(kidslt6) + prob_b(7) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (7) dydxdydx(2) = dnorm_y * prob_b(2)dydx(3) = dnorm_y * prob_b(3)dydx(4) = dnorm_y * prob_b(4)dydx(5) = dnorm_y * prob_b(5)dydx(6) = dnorm_y * prob_b(6)dydx(7) = dnorm_y * prob_b(7)
marginal effect の求め方
説明直前の回帰の係数 @coefs をprob_b というベクトルに代入説明変数が平均値をとる場合のy* を計算し, yhat というスカラー変数に代入yhat の値での標準正規分布の密度関数の値を計算し,それをdnorm_y というスカラー変数に代入Marginal effects の結果を代入するベクトルを dydx とする(要素数は 7 個)各要素に,それぞれの説明変数の限界効果を代入
Eviews のコマンドウィンドウで次のようにタイプ
probit 分析の結果を開いたまま,View/ Representation とたどり,そこの結果を張り付けて編集すると楽
説明変数の平均値をここにコピーする(定数項は 1 とする)
係数の値
この列は B 列と C 列の掛け算
上のセルの合計
関数を使ってy* における密度関数の値を得る norm.s.dist( , )
marginal effects
marginal effect の求め方 Excel を用いた方法
問題 (1)
• MROZ.RAW のデータを用い,女性の労働参加を,線型確率モデルと logit model, probit model で推計し,係数を解釈せよ。–被説明変数: inlf 労働力であれば 1–説明変数: nwifeinc( non wife income),
educ( 教育年数), exper( 実際に働いた年数), , age (年齢), kidslt6 ( 6 歳未満の子供の数) , kidsge6 ( 6-18 歳の子供の数)
• logit model の場合の f(y*) は ?
問題 (2)• 問題 (1) の説明変数に expersq(exper の平
方)を加え, probit model および logit model で推計し, marginal effects を求めよ。
の場合,となることに注意
vector prob_b = @coefsscalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * ( @mean(exper ) )^2 + prob_b(6) * @mean(age) + prob_b(7) *@mean(kidslt6) + prob_b(8) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (8) dydxdydx(2) = dnorm_y * prob_b(2)dydx(3) = dnorm_y * prob_b(3)dydx(4) = dnorm_y * ( prob_b(4) + 2 * prob_b(5) * @mean(exper) )dydx(6) = dnorm_y * prob_b(6)dydx(7) = dnorm_y * prob_b(7)dydx(8) = dnorm_y * prob_b(8)
marginal effect の求め方
説明直前の回帰の係数 @coefs をprob_b というベクトルに代入説明変数が平均値をとる場合のy* を計算し, yhat というスカラー変数に代入Yhat の値での標準正規分布の密度関数の値を計算し,それをdnorm_y というスカラー変数に代入Marginal effects の結果を代入するベクトルを dydx とする(要素数は 8 個)各要素に,それぞれの説明変数の限界効果を代入
この例では, expersq というexper の平方の項があるため, dydx(4) の計算は他とは異なっている
Eviews のコマンドウィンドウで次のようにタイプ
probit 分析の結果を開いたまま,View/ Representation とたどり,そこの結果を張り付けると便利
説明変数の平均値をここにコピーする
係数の値
この列は B 列と C 列の掛け算
上のセルの合計
関数を使って y* における密度関数の値を得る
marginal effects
marginal effect の求め方 Excel を用いた方法
Tobit model• 耐久財の購入量 (y) の決定
– 購入しない人 (y=0) が存在– y>0 と y=0 のみが観察される
• この場合も次のようなモデルを考える– y* 観察不可能な変数で,耐久財の購入量 (y) を決定する潜在変
数
0if00if
*
**
11*
yyy
y
uxxy kk
Tobit model の当てはめ
x
yOLS の当てはめ
y* と x の関係Tobit model
Tobit model の応用
• 女性の労働供給–MROZ.RAW–労働参加していない女性が一定割合存在
• 耐久財の購入• 低賃金労働者の労働供給–生活保護の受給との関係で
Tobit model の解釈
),0max(
,0~*
2
*
yy
Nu
uxy
xyx
xxuxuuxy
0Pr1Pr
Pr0Pr0Pr
Tobit model の解釈 (2)
f
f
xxxxx
xxx
xuuxxuuxyy
1
|E|E0|E
)(1
)(|Ec
cczz
f
ここで, z~N(0,1) のとき,次の式が成り立つことを用いている inverse Mills ratio
y>0 の条件付きの期待値は, xb よりも大きくなることが重要
Tobit model の解釈 (3)
f
xxxxxx
yyyyy
0Pr00Pr0|EE
y の unconditional expected value
説明変数 x が与えられた場合のyの期待値
y>0 の条件付き期待値は前頁
Tobit モデルの解釈 (4)
jj
jj
xyx
xyx
f
E
0Pr
結果だけまとめておく
Tobit の推定方法
menu で Quick Estimate equation
Estimation settingsの method で CENSORED - ..を選択する
誤差項の分布を選択( Tobit は正規分布)
打ち切りの位置を指定する。 0以外の値も,右側の指定もできる。
E-Views での Tobit modelの推定
s の推計値
Dependent var hours
Tobit OLS
Coef s.e. Coef s.e.
C 965.31 446.44 1330.48 270.78
NWIFEINC -8.81 4.46 -3.45 2.54 EDUC 80.65 21.58 28.76 12.95
EXPER 131.56 17.28 65.67 9.96
EXPERSQ -1.86 0.54 -0.70 0.32 AGE -54.41 7.42 -30.51 4.36
KIDSLT6-
894.02
111.88 -442.09 58.85
KIDSGE6 -16.22 38.64 -32.78 23.18
1122.02 750.179
Tobit model と OLS の比較
E-Views での出力Tobit の場合, xj の 1 単位の増加y の期待値に与える影響をみるためには, x’b/s を計算し,標準正規分布関数からその涙液分布を計算する必要あり。単純に比較できない
問題 (3)
• MROZ.RAW• 女性の労働時間の回帰分析– 40% 強が労働時間 0–被説明変数: hours–説明変数: nwifeinc, educ, exper, exper^2,
age, kidslt6,kidsge6– OLS と Tobit model で推計し,結果を解釈せ
よ