静学的パネルデータの分析2 - Keio Universityuser.keio.ac.jp/~nagakura/ts2020b/ts2020b_slide2.pdf6 最小二乗推定量の行列表現最小二乗推定量の行列表現

静学的パネルデータの分析2

(最小二乗推定量の行列表現)

担当: 長倉大輔

1

22

最小二乗推定量の行列表現

◼ 多変量回帰モデルの行列表現

被説明変数 Yi (i =1,…,n) は K個の説明変数 X1i,

X2i…, XKi (i =1,…,n) と以下の関係があるとする。(定数項を入れる場合は、X1i =1 とすればよい)

Yi = β1 X1i + … + βk XKi + εi

ここで εiは被説明変数の説明変数だけでは説明できない部分をまとめたものである。

33


ここで

, , , ,

とすると

⇒

のように簡潔に表現できる。

1 1 11 1 1

2 1 12 2 2

1 1 2

...

...

:

...

K K

K K

n n K K n

Y X X

Y X X

Y X X

= + + +

= + + +

= + + +

= +Y Xβ ε

=

nY

Y

Y

:

2

1

Y

11 21 1

12 22 2

1 2

...

...

: : : :

...

K

K

n n Kn

X X X

X X X

X X X

=

X

1

2

:

n

=

ε

1

2

:

K

=

β

44


◼ 単回帰モデルの行列表現

単回帰モデル、すなわち定数項と1つの説明変数しかない場合は、先ほどの行列 Xは

,

となる。また説明変数ベクトル βをとしよう。

以下では説明の簡単化のために単回帰モデルの場合について考える。

=

nX

X

X

1

::

1

1

2

1

X

0

1

=

β

55


◼ 残差平方和の行列表現

b = (b0, b1)T とすると、残和平方和の行列表現は

となる。行列に関する微分を知っていれば、このSSRのbに関する微分は

となる(行列に関する微分については講義Webの資料を参照)。

2 T0 1 0 1

1

( , ) ( ) ( ) ( )

n

i i

i

SSR b b Y b b X

=

= − − = − − Y Xb Y Xb

0 1

0 T T0 1

0 1

1

( , )

( , )2 2

( , )

SSR b b

bSSR b b

SSR b b

b

= = − +

X Y X Xbb

66


◼ 最小二乗推定量の行列表現

この SSRの bに関する微分を 02,1 とおいたもの、すなわち

は 1 階の条件の行列表現に他ならない。ここで 0r,s は(太字であることに注意)全ての成分が 0 の r× s行列とする。

これを bについて解くと

という最小二乗推定量の行列表現が得られる。

T T2,12 2− + =X Y X Xb 0

YXXXbT1T )( −=

77


この行列表現を実際に計算してみると

となる。

1

1

1 11 1T 1 T

1 12

1 1 1

2

2

2

1 1

11 ... 1 1 ... 1ˆ ( ) : : :

... ...1

1

n n

i i

i i

n n nn n

n n i i i i

i i i

i

n n

i i

i i

n X YX Y

X X X XX Y X X X Y

X

n X X

−

−

= =−

= = =

= =

= = =

= −

β X X X Y

1 1 1

1 1

2

1 1 1 1

2

2

1 11 1

1

n n n

i i

i i i

n n

i i i

i i

n n n n

i i i i i

i i i i

n nn n

i i i ii i ii ii i

X Y

X n X Y

X Y X X Y

X Y n X Yn X X

= = =

= =

= = = =

= == =

− −

−

= − + −

1

n

=

88


一般に説明変数が K 個ある場合は

Y = Xβ + ε

において、b = (b1, …, bK)T とすると、残差平方和

を最小にする bは、まったく同じ議論により

b = (X TX)–1XTY

となる。これが βの最小二乗推定量、である。β̂

21 2 1 1 2 2

1

T

( , , ..., ) ( ... )

( ) ( )

n

K i i i K Ki

i

SSR b b b Y b X b X b X

=

= − − − −

= − −

Y Xb Y Xb

99

最小二乗推定量の性質

◼ 誤差項に関する仮定

説明変数 Xki, k = 1,…,K と誤差項 εiは確率変数と考え、以下の仮定のもとで最小二乗推定量のいくつかの性質を導く。

(A1) (条件付き期待値 0 の仮定)

E(εi | X) = 0, i = 1,…,n.

(A2) (条件付き均一分散の仮定)

var (εi | X) = E(εi2 | X ) = σ2.

(A3) (誤差項の独立性の仮定)

εi, i =1,…, Nは互いに独立。

1010

最小二乗推定量の性質

(A4) (説明変数についての仮定)

xi = [X1i, X2i, …., XKi]T とする。この時、この K×1 ベク

トル xi, i =1,…, nは互いに独立でであ

るとする。ここで Qは K×Kの正値定符号行列とする。

Qの (r, s)成分(r, s = 1,…, n) は E(Xri Xsi) となっていることに注意。

これらの仮定は緩めることもできるが、とりあえず説明の簡単化のため、このように仮定する。ただし、ここではクロスセクションデータを念頭においているため、これらの仮定もそこまで厳しい仮定というわけではない。

T( )i iE =x x Q

1111

線形回帰分析仮定(A1)は

E(ε | X) = 0n,1

と表しても同じことである(ベクトルの期待はそれぞれの成分の期待値が並んだものであることに注意)。

また仮定(A2), (A3) は、確率ベクトル εの条件付き分散共分散行列(次ページ参照)、 var(ε | X) が

var(ε | X) = σ2In (Inは n×nの単位行列)

となることを意味している。

1212

線形回帰分析◼ 分散共分散行列

確率ベクトル z = [z1, z2,…, zn]Tの分散共分散行列とは、

その成分が zi, i=1,..,nの分散と共分散からなる行列で

var(z) = E([z – E(z)] [z – E(z)]T )

と定義される(条件付きの場合は上記の期待値が全て条件付き期待値に置き換わるだけ)。

実際に計算してみると (次ページ)

1313

線形回帰分析

のようになり、第 i対角成分が ziの分散、第(i, j) 成分がzi と zjの共分散になっている。

1 1

2 21 1 2 2

21 1 1 1 2 2 1 1

22 2 1 1 2 2 2 2

( )

( )var( ) ( ) ( ) ... ( )

:

( )

{[ ( )] } {[ ( )][ ( )]} ... {[ ( )][ ( )]}

{[ ( )][ ( )]} {[ ( )] } ... {[ (

n n

n n

n n

z E z

z E zE z E z z E z z E z

z E z

E z E z E z E z z E z E z E z z E z

E z E z z E z E z E z E z E z

−

− = − − − −

− − − − −

− − − −=

z

21 1 2 2

1 1 2 1

2 1 2 2

1 2

)][ ( )]}

: : ... :

{[ ( )][ ( )]} {[ ( )][ ( )]} ... {[ ( )] }

var( ) cov( , ) ... cov( , )

cov( , ) var( ) ... cov( , )

: : ... :

cov( , ) cov( , ) ... var( )

n n

n n n n n n

n

n

n n n

z E z

E z E z z E z E z E z z E z E z E z

z z z z z

z z z z z

z z z z z

− − − − − −

=

1414

線形回帰分析var(ε | X)を実際に計算してみると、仮定(A1)よりE(ε |X ) = 0n,1 、仮定(A2) より E(εi

2 | X) = σ2、仮定(A3) より E(εi εj | X ) = 0 なので

となる。

21 1 2 11

22T 1 2 2 2

1 2

21 2

21 1 2 1

22 1 2 2

...

...var( | ) ( | ) ...

: : : ... :

...

( | ) ( | ) ... ( | )

( | ) ( | ) ... ( |

n

nn

nn n n

n

n

E E E

E E E

E E E

= = =

=

ε X ε ε X X X

X X X

X X

2

2

2 21 2

2

0 ... 0

) 0 ... 0

: : ... : : : ... :

( | ) ( | ) ... ( | ) 0 0 ...n n n

n

E E E

=

=

X

X X X

I

1515

演習問題問題1 一般に K× K分散共分散行列 Aは, K×1 ベクトル x ≠ 0に対して、

xTAx ≥ 0

であることを示しなさい。これは分散共分散行列が半正値定符号行列であることを示している。

問題2仮定 (A1) – (A2) のもとで

E(ε) = 0および var(ε) = σ2 In

であることを示しなさい(つまり無条件期待値と無条件分散共分散行列も同じ)。(ヒント：重複期待値の法則)

1616

線形回帰分析◼ 最小二乗推定量の性質

仮定(A.1) – (A.4) の下で、βの最小二乗推定量は以下のような性質を持っている。

(P1) は βの不偏推定量である。

(P2) は βの一致推定量である。

(P3) は漸近的に正規分布に従う。

(P4) は (X という条件付きで)最良線形不変推定量(Best linear unbiased estimator) である。

(P1) – (P3) について順に見て行く( P4は来週)。

β̂

β̂

β̂

β̂

β̂

1717

線形回帰分析

◼ 最小二乗推定量の不偏性

まずを以下のように書き直す。

X という条件付き期待値を計算すると、

よって、仮定(1)および重複期待値の法則より

となり、は βの不偏推定量である事がわかる。

εXXXβ

εXXXXβXXX

εXβXXXYXXXβ

T1T

T1TT1T

T1TT1T

)(

)()(

)()()(ˆ

−

−−

−−

+=

+=

+==

T 1 Tˆ( | ) ( ) ( | )E E−= +β X β X X X ε X

β̂

ˆ ˆ( ) [ ( | )] [ ]E E E E= = =β β X β β

β̂

1818

線形回帰分析◼ 最小二乗推定量の一致性(ラフな説明)

最小二乗推定量が確率収束する、すなわち

を示す(→pで確率収束を表すとする) これは、先ほどの表現において、(XTX)–1XTε →p 0K,1

を示せばよい (Y = c + X, X→p 0 の時、Y→p cなので)

以下ではにおいて

およびとなることより、

この第2項が 0に収束することを示すことを考える。

ˆp→β β

T 1 Tˆ ( )−= +β β X X X ε

1T T

T 1 T( )n n

−

−

=

X X X εX X X ε

1T

1p

n

−

−

→

X XQ

T

pn

→X ε

0

1919

線形回帰分析XTXは

と書き直せる。ここで xi = [X1i, X2i, …., XKi]Tである。

11 1 11 1T

1 1

21 1

1 1

T

12

11 1

n K

K Kn n Kn

n n

i i Kii i n

i i

n n i

Ki i Kii i

X X X X

X X X X

X X X

X X X

= =

=

= =

=

= =

X X

x x

2020

線形回帰分析同様に XTεは

と書き直せる。これより

と書き直せる。

1111 1 1

T

11

11

n

i ii nn

i i

n iK Kn n

i ii

XX X

X XX

=

=

=

= = =

X ε x

11T T

T 1 T T

1 1

1 1( )

n n

i i i i

i in n n n

−−

−

= =

= =

X X X εX X X ε x x x

2121

線形回帰分析仮定(A1)より E(xiεi) = E[xi E(εi |X)] = 0であること、また仮定(A4)より E(xi

Txi) = Qである。さらに仮定(A3), (A4) のもとで、大数の法則より

および

であるので、連続射影定理(continuous mapping

theorem)より

となる。よっては βの一致推定量である。

1

1n

i i p

in

=

→x 0 T

1

n

i i p

i=

→x x Q

1

T 1 T T 1

1 1

1 1( ) 0

n n

i i i i p

i in n

−

− −

= =

= → = X X X ε x x x Q 0

β̂

2222

線形回帰分析

◼ の分散共分散行列

の分散共分散行列は

と表せるが

なので

となる。

T T 1 T T T 1

T 1 T T T 1

2 T 1 T T 1

2 T 1

ˆ ˆ[( )( ) | ] [( ) ( ) | ]

( ) ( | ) ( )

( ) ( )

( )

E E

E

− −

− −

− −

−

− − =

=

=

=

β β β β X X X X εε X X X X

X X X εε X X X X

X X X X X X

X X

β̂

β̂

T Tˆ ˆ ˆ ˆ ˆvar( ) [( )( ) ] { [( )( ) | ]}E E E= − − = − −β β β β β β β β β X

2 T 1 2 T 1ˆvar( ) [ ( ) ] [( ) ]E E − −= =β X X X X

2323

線形回帰分析◼ 最小二乗推定量の漸近分布

以下を仮定する(A5) 全ての i, kおよび δ > 0 に対して

E( | εi |2+δ) < ∞, E( |Xki|2+δ ) < ∞

が成り立つ。もしくは

(A6) εi と xiはそれぞれ同一の分布に従う。

ここまで εiおよび xiについては分散共分散行列(2次モーメント)が有限で独立という仮定しか置いていなかったが、漸近分布を導出するには、より高次のモーメントの存在(A5)、もしくは、同一分布(A6)を仮定する必要が出てくる。

2424

線形回帰分析仮定(A1) – (A5) もしくは仮定(A1) – (A4) (A6)のもとで、それぞれの仮定の下で成り立つ、中心極限定理(Central limit theorem) を用いると、最小二乗推定量は漸近的に(K変量)正規分布に従うことを示すことができる

( の漸近分布)

ここで→dは分布収束を表す。ほぼ同じ表し方として

とも書く。

β̂

β̂2 1ˆ( ) ( , )dn N −− →β β 0 Q

2 11ˆ ~ ,a Nn −

β β Q

2525

線形回帰分析

◼ m変量正規分布

m変量確率変数 Z = (Z1,…, Zm)Tが m変量正規分布N ( μ, Σ ) に従うとは Z1,…, Zmのそれぞれが正規分布に従いその平均が E(Z) = μ、分散共分散行列がvar(Z) = Σであるような分布の事である。

2626

線形回帰分析◼ 誤差項の分散の推定

線形回帰モデルの誤差項 εiの分散 σ2の推定を考えよう

通常 σ2の推定には最小二乗推定量を代入して得た残差平方和 SSR( )を n – kで割った

が用いられる。ここで

である。

β̂

kns

n

i i

−= =1

2

2̂

1 1 2 2ˆ ˆ ˆˆ ... , 1, ...,i i i i k kiY X X X i n = − − − − =

2727

線形回帰分析◼ s2の性質

誤差項 εiの分散 σ2の推定量として s2には次の性質がある。仮定(A1) ~ (A4)のもとで

(S1) s2 は σ2の不偏推定量である。

(S2) s2 は σ2 の一致推定量である。

(S3) s2 は ( X という条件付きで) σ2の最良2次不偏推定量である。

以下では（S1)だけを確認する。

2828

線形回帰分析◼ s2の不偏性

s2が σ2の不偏推定量である事を見て行こう。これはそれほど難しくないが、いろいろと準備がいる。まずとするとこのは

と表す事ができる。ここでM = In – X(X TX) –1X である。MはM2 = MM = Mを満たす(演習問題)。

T1 2ˆ ˆ ˆˆ ( , , ..., )n =ε

T 1 T

T 1 T

ˆˆ

( )

( ( ) )n

−

−

= −

= −

= −

=

ε Y Xβ

Y X X X X Y

I X X X X Y

MY

ε̂

2929


さらに

であるから

である。

ˆ

( )

=

= +

= +

=

ε MY

M Xβ ε

MXβ Mε

Mε

0

XX

XXXXXXMX

=

−=

−= − ))(( T1T

3030


よってs2の分子の部分は

となる。期待値をとると

となる。ここで mijはMの(i, j)成分であり tr (A) とは行列Aの対角要素の和を表す。

T

1 1

1 1

2 2

1

( | ) ( | )

( | )

tr( )

n n

ij i ji j

n n

ij i ji j

n

iii

E E m

m E

m

= =

= =

=

=

=

= =

ε Mε X X

X

M

2 T T T T

1ˆ ˆ ˆ ( ) ( )

n

ii

== = = = ε ε Mε Mε ε MMε ε Mε

3131


(もう少し…)

ここで tr(M) = n – kである事が示せるので(演習問題)、

が得られる。よって s2の条件付き期待値は

となる。したがって、s2の無条件期待値も σ2になるので、s2は σ2の不偏推定量である。

T 2( | ) ( )E n k = −ε Mε X

2 T 21( | ) ( | )E s E

n k= =

−X ε M ε X

3232

演習問題スライドに出てきた行列

M = In –X(XTX)–1XT

について

問題3 Mは対称行列である事を証明しなさい

問題4 MはM2 = MM = Mを満たす事を証明しなさい

(このような行列を巾等行列という)

問題5 tr(M) = n – Kである事を証明しなさい。

問題5のヒント: 2つの行列 A, Bに対して、もし AB も BA

も定義されるならば tr(AB) = tr(BA)である。

Documents

静学的パネルデータの分析2 - Keio Universityuser.keio.ac.jp/~nagakura/ts2020b/ts2020b_slide2.pdf6 最小二乗推定量の行列表現 最小二乗推定量の行列表現

静学的パネルデータの分析2 - Keio Universityuser.keio.ac.jp/~nagakura/ts2020b/ts2020b_slide2.pdf6 最小二乗推定量の行列表現最小二乗推定量の行列表現