71
13章 回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係 を説明しようとするもの. 厳密な意味での因果関係で はない。 1

13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

13章 回帰分析の基礎

2つ以上の変数についての関係を見る.

1つの変数を結果,その他の変数を原因として,因果関係を説明しようとするもの.

厳密な意味での因果関係ではない。

1

Page 2: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例(因果・相関関係等)

勤務年数が長ければ,年間給与は上がる.

景気が良くなれば,株価は上がる

父親の身長が高ければ,子供の身長も高い.

価格が低下すれば需要が増える.

自身の兄弟数が多いと,育てる子供の数も多い.

サッカー人気が上がると,野球人気が落ちる.

2

Page 3: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例(因果・相関関係等)

円が高くなると,輸出不振になる.

フォアボールが多いと失点が増える.

親の年収が高いと,子供の成績もよい.

投手の防御率が低いと,勝利数も多い.

ルックスと性格の関係

天候と売り上げ

与四球数が多いチームの勝率は低い

不景気だとクマのキャラクターの売り上げが上がる.

3

Page 4: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例(因果・相関関係等)

B級グルメと地域経済

血液型と性格

美人と生涯所得の関係

トヨタ株価と日経平均

勉強時間とテスト結果

映画の興行収入と作品としての評価

シュート数と得点

4

Page 5: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例(因果・相関関係等)

東京ディズニーランドとUSJの入場者数の関係.

海外旅行者と国内旅行者の数の関係

打率と出塁率の関係

食事の取り方と体重の関係

顔と性格の関係

ボール支配率と勝率の関係

5

Page 6: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例(因果・相関関係等)

気温とアイスの売り上げ

ファーストサーブの成功率と勝率

親の寿命と子の寿命

親の結婚年齢と子の結婚年齢

出席率と成績

勉強時間と成績の関係

煙草の値段と喫煙率

6

Page 7: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例(因果・相関関係等)

CDの売り上げと着うたフルのダウンロード数

月収とギャンブル収支

喫煙者と職業

非正規労働者の増減と企業数の増減

天候と外出の関係

7

Page 8: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

ここで勉強すること

散布図と相関係数

最小2乗法と回帰直線

決定係数

重回帰分析

8

Page 9: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

株価収益率データの標本は?母集団は?

標本

2006年1月の状況

日本経済

母集団

2006年2月の状況

2006年2月の状況

表13-1 日経平均とトヨタ自動車の株価の変化率(2006年,月末値)

単位:%

1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月

日経平均 3.3 -2.7 5.3 -0.9 -8.5 0.2 -0.3 4.4 -0.1 1.7 -0.8 5.8

トヨタ -0.7 2.8 2.9 3.6 -11.0 1.0 1.2 5.1 0.8 7.9 1.3 13.4

表2-1,表5-6より作成

Page 10: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

1.散布図と相関係数

表13-1 日経平均とトヨタ自動車の株価の変化率(2006年,月末値)

単位:%

1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月

日経平均 3.3 -2.7 5.3 -0.9 -8.5 0.2 -0.3 4.4 -0.1 1.7 -0.8 5.8

トヨタ -0.7 2.8 2.9 3.6 -11.0 1.0 1.2 5.1 0.8 7.9 1.3 13.4

表2-1,表5-6より作成

10

ixiy

-15

0

15

1月 2月 3月 4月 5月 6月 7月 8月 9月 10月 11月 12月

変化率(%)

2006年

図13-1 日経平均とトヨタ自動車の株価変化率のグラフ

(2006年)a. 日経平均・トヨタ自動車の月次変化率の推移

日経平均

トヨタ自動車

-15

0

15

-15 0 15

トヨタ自動車の

株価変化率(%)

日経平均の変化率(%)

b.散布図

Page 11: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

散布図と相関(直観的解釈)

11

a. 正の相関 b.負の相関

c.無相関 d.強い正の相関

Page 12: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散とは何か

12

ⅠⅡⅢⅣ

x

y

1x

1y),( 11 yx

散布図(相関図)の作成

の平均である.))(( yyxx ii

Page 13: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散とは何か(第Ⅰ象限)

13

x

y

x

y

),( ii yx

の平均である.))(( yyxx ii

ix

iy

0)()( yyxx ii

Page 14: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散とは何か(第Ⅱ象限)

14

x

y

x

y

),( ii yx

の平均である.))(( yyxx ii

ix

iy

0)()( yyxx ii

Page 15: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散とは何か(第Ⅲ象限)

15

x

y

x

y

),( ii yx

の平均である.))(( yyxx ii

ix

iy

0)()( yyxx ii

Page 16: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散とは何か(第Ⅳ象限)

16

x

y

x

y

),( ii yx

の平均である.))(( yyxx ii

ix

iy

0)()( yyxx ii

Page 17: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散とは何か(第Ⅰ~Ⅳ象限)

17

x

y

x

y

の平均である.))(( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

Page 18: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散の符号

18

x

y

x

y

n

i iixy yyxxn

S1

))((1

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0xyS

Page 19: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散の符号

19

x

y

x

y

n

i iixy yyxxn

S1

))((1

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0xyS

Page 20: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

共分散の符号

20

x

y

x

y

n

i iixy yyxxn

S1

))((1

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0)()( yyxx ii

0xyS

Page 21: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

XとYの共分散

相関係数

21Yの標準偏差Xの標準偏差

22 )(1

)(1

))((1

yyn

xxn

yyxxn

SS

Sr

ii

ii

yx

xy

xy

Page 22: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

相関係数

22

平均0

標準偏差1

平均0

標準偏差1

y

i

x

i

yx

ii

yx

xy

xy

S

yy

S

xx

n

SS

yyxxn

SS

Sr

)()(1

))((1

Page 23: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

23

相関係数の性質

最大1,最小−1の値をとる.

相関係数の絶対値が1に近い程,相関は強いことが分かる.

相関係数の絶対値が1になるのは,データ点が一直線上に位置するときのみである.

相関係数は,直線的な関係の強さをはかるもので,曲線的な関係を調べるのには向いていない.

Page 24: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

相関係数と散布図の関係

24

Page 25: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

2 最小2乗法と回帰直線

これまで,2つの変数間の関係の深さについて考えてきた(相関係数)

次に,変数に役割を与え,一方の変数を用いて他方の変数を説明することを考える.

この関係は,必ずしも,因果関係でなくてもよい.

25

Page 26: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

直線 y=α+βx とは?

26

1

xy

点(0, α) を通る傾き β の直線

Page 27: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

直線 y=b+c(x-a) とは?

a

c

27

1

)( axcby

点(a, b) を通る傾き c の直線

b

Page 28: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

直線 y=α+βx を回帰直線と考えるとき

28

(xi ,yi )

xi

yi xy

ii xy *}

i

iiiii xyy *

観測値には誤差が加わっている

Page 29: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

直線 y=α+βx を回帰直線と考えるときの観測値の得られ方

3x

3

29

),( 11 yx

2yxy

1

1x

1y

2x

),( 22 yx

2

Page 30: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰直線 y=α+βx は未知である

xbay

30

xy

データから推定するしかない。

直線であるという保証もない。

Page 31: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

直線 y=α+βx の推定法

上の式を最小にするように,αとβを決める.

最小2乗法により決めるとも言う.

31

2

11

2 )(11

)5.1(

n

i

ii

n

i i xynn

2

11

2 )()6.1(

n

i

ii

n

i i xySSE

上の Sum of Squared Errors を最少化するとも考えられる.

Page 32: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰直線 y=α+βx の推定法(図解)

xbay

2x

11 xbay

321x

1y

1xba

22 xbay

赤線の長さの2乗和を最小にする a, b を求めよう。

2y

2xba

2

1

)(

n

i

ii xbay

Page 33: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

最小2乗推定値の公式結果を先に示す

33

xx

xy

n

i i

n

i ii

s

s

xx

yyxxb

1

2

1

)(

))(()7.1(

xbya )8.1(

sxy 1

n(xi x )(yi y ), sxx

1

n(xi x )2

i1

n

i1

n

ここで,

Page 34: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰直線とは

34x

y

xx

xy

i

ii

s

s

xx

xxyyb

2)(

)()(

)( xxbyy

xbya bxay

の直線傾き

を通る

b

yx ),(1

b

a

Page 35: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

最小2乗推定値の求め方(1)難

35

2)}()(){( xbayxxbyy ii

n

i

ii xbay1

2)( 2)( xbxbxbayyy ii

})()(2

))((2))((2

)()()({ 2222

xxxbayb

yyxbayyyxxb

xbayxxbyy

i

iii

ii

Page 36: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

最小2乗推定値の求め方(2)難

})()(2

))((2))((2

)()()({ 2222

xxxbay

yyxbaybyyxxb

xbayxxbyy

i

iii

ii

0 36

)()(2

)()(2)()(2

)()()( 2222

yyxbay

xxxbaybxxyyb

xbaynxxbyy

i

iii

ii

Page 37: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

最小2乗推定値の求め方(3)難

になる.のとき0xbya 37

2

222

1

2

)()()(2

)()()(

xbaynxxyyb

xxbyyxbay

ii

ii

n

i

ii

1.この部分を最小にするように b を決める

22

2

22

)()(

)(

)()(2)(

yyxbayn

bxx

xxyybxx

i

i

ii

i

Page 38: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

最小2乗推定値の求め方(4)難

2

2

2

2)

)(

)()(()

)(

)()((

xx

xxyy

xx

xxyyb

i

ii

i

ii

2)(

)()(

xx

xxyyb

i

ii のとき最小となる。 38

bxx

xxyyb

i

ii

2

2

)(

)()(2

Page 39: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰直線とは

39x

y

xx

xy

i

ii

s

s

xx

xxyyb

2)(

)()(

)( xxbyy

xbya bxay

の直線傾き

を通る

b

yx ),(1

Page 40: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

)(ˆiiiii xbayyye

残差とは? 実際の観測値と推定値との差を残差と呼ぶ.

)()(

)}({

)(

xxbyy

xxbyy

xbaye

ii

ii

iii

40

(xi ,yi )

xi

yi

ie

ii xbay ˆ

x

y

)( xxby

xbay

Page 41: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

残差プロット

y 軸に残差をとったものを残差プロットと呼ぶ

41

(xi ,yi )

xi

yi

ie xbay

ii xbay ˆ

Page 42: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

残差の和と残差の平方和

残差の総和は0である.

42

)(11

i

n

i

i

n

i

i xbaye

2

1

22

1

)(1

)(1

i

n

i

ii

n

i

iee xbayn

eeen

s

e 0

当然のことだが、残差の平均も0である.

残差の分散は,下のように表される.

n

i

i

n

i

i xxbyy11

)()( 0

xbya

Page 43: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

残差分散

)(ˆ xxbyybay iii

yyxx

xy

yyss

ss

2

1

2

1

)(1

xxbyyn

i

n

i

i

xx

xy

s

sb

43

n

i

iiee yyn

s1

2)ˆ(1

222 )(1

))((1

2)(1

xxn

bxxyyn

byyn

iiii

xx

xx

xy

xy

xx

xy

yy ss

ss

s

ss

2

2

Page 44: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

残差平方和と相関係数の関係

44

相関係数:xyr

相関係数が1に近いほど,残差平方和は小さくなる.つまり,推定精度が高い.

を決定係数と呼ぶ.22

xyrR

)1( 2

xyyyee rss

Page 45: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例題13.2 勤続年数と給与額

45

)( xxby

xbay

xx

xy

s

sb 473.7

97.119

53.896

9.217

56.13473.720.319

xbya

)56.13(473.720.319

473.79.217

x

xy

Page 46: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

相関係数

例題13.2(続き)

46

y = 7.473x + 217.9R² = 0.991

0.0

50.0

100.0

150.0

200.0

250.0

300.0

350.0

400.0

450.0

500.0

0.0 10.0 20.0 30.0 40.0

所定内給与額(千円)

yyxx

xy

xyss

sr

58.675497.119

53.896

9959.0

回帰の決定係数

222 )9959.0( xyrR

991.0

Page 47: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

例題13.2(続き)

47-15.00

-10.00

-5.00

0.00

5.00

10.00

15.00

0.0 10.0 20.0 30.0 40.0

)1( 2Rss yyee

84.54

)991.01(58.6754

残差プロット

Page 48: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

3 決定係数

決定係数は相関係数を2乗したものであるが,その他にもさまざまな解釈ができる.

48

相関係数:xyr

回帰の決定係数という:)( 22

xyrR

Page 49: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数の意味(小さな相関)図を書いてみる

y

x

)1( 2

xyyyee rss

49

22 )(

11iiiee xbay

ne

ns

ie

xbay

x

y

1e

2e

n

i

iyy yyn

S1

2)(1

相関係数が小さければ,残差分散は小さくならない

Page 50: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数の意味(大きな相関)図を書いてみる

y

x

)1( 2

xyyyee rss

50

22 )(

11iiiee xbay

ne

ns

x

xbay

y

n

i

iyy yyn

S1

2)(1

相関係数が大きければ,残差分散は小さくなる

Page 51: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

y の変動の分解と決定係数)ˆ()ˆ( yyyyyy iiii

51

(xi ,yi )

xi

yi

xbay

ˆ y i

x

y

yyi

平均からの偏差

残差: 回帰直線では説明しきれない部分

回帰直線で説明できる部分

yyi ˆ

iii yye ˆ

Page 52: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

y の全変動(平均からの変動)

52

(xi ,yi )

xi

yi

xbay

x

y

yyi

平均からの偏差

2

1

)(

n

i

i yy

Page 53: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰で説明されない変動(残差)

53

(xi ,yi )

xi

yi

xbay

x

y

ii yy ˆ

残差

n

i

i

n

i

ii eyy1

22

1

)ˆ(

ˆ y i

iii yye ˆ

Page 54: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰で説明される変動

54

(xi ,yi )

xbay

x

y

yyi ˆ

説明できた部分

2

1

)ˆ(

n

i

i yy

ˆ y i

Page 55: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数とは(2)難

)(ˆ xxbyy ii

2)(

))((

xx

yyxx

s

sb

i

ii

xx

xy

55

(yi y i1

n

)2 {(yi ˆ y i ) ( ˆ y i y )}2

(yi ˆ y i )2 ( ˆ y i y )2 2 (yi ˆ y i )( ˆ y i y )

0)())((

)}()}{({)ˆ)(ˆ(

22

xxbxxyyb

xxbxxbyyyyyy

iii

iiiiii

なぜなら、

Page 56: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数とは(3) 難

2

1

2

2

1

2

)(

)ˆ(

)(

)ˆ(1

n

i

i

i

n

i

i

ii

yy

yy

yy

yy

56

222

1

)ˆ()ˆ()( yyyyyy iii

n

i

i

決定係数:R2

全変動のうち、回帰による変動の占める割

( ˆ y i y )2

(yi y i1

n

)2

{b(xi x )}2

(yi y i1

n

)2

b21

n(xi x )2

1

n(yi y

i1

n

)2

sxy

2

sxx syy

回帰からの変動

全変動 回帰による変動

Page 57: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数とは(4)難

57

2

1

2

2

1

2

2

1

2

2

)(

1

)(

)ˆ(1

)(

)ˆ(

n

i

i

i

n

i

i

ii

n

i

i

i

yy

e

yy

yy

yy

yyR

R2 ( ˆ y i y )2

(yi y i1

n

)2

sxy

2

sxx syy

相関係数の2乗

この表現が後に重要になる

Page 58: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数のもう一つの意味回帰モデルの説明力を示すもの.

2)ˆ( ii yy 2)ˆ( yyi

58

2)( yyi

と呼ぶ.この部分を 2R

2)( yyi 2)( yyi

2)ˆ( ii yy 2)ˆ( yyi

計算すれば,この等式が成り立つことが分かる.

両辺を で割ると, 2)( yyi

2)( yyi

2)( yyi

1

Page 59: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数の意味(さらに)

59

12R

2)( yyi

2)ˆ( ii yy

2)( yyi 2)( yyi

2)ˆ( ii yy 2)ˆ( yyi

2)( yyi

2)( yyi

1

2R

1 2)( yyi

2

ie

Page 60: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数のまとめ

60

)1( 2

xyyyee rss

22

xyrR 2)( yyi

2)ˆ( yyi

2R

2R 1 2)( yyi

2

ie

決定係数は,全変動のうち回帰で説明できる割合である.

決定係数は,相関係数の2乗である.

決定係数は,全変動のから回帰で説明できなかった部分を除いた割合である.

Page 61: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

4 重回帰モデル

家計の消費水準を,可処分所得と消費者物価により説明する.

一人当り賃金上昇率を,消費者物価上昇率と失業率により説明する.

株価水準の変動を内外金利水準や鉱工業生産指数,為替レート等の変動や,金融的変数の変動で説明したりする.

説明変数が複数あるということは、思わぬ問題を引き起こす。詳しくは、計量経済学で。

61

Page 62: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

重回帰モデル(数式,推定法)

データが得られるメカニズムは以下の式で表される.

62

(3.1) yi 1 x1i 2 x2i K xKi i

2

2211

1

)()2.3( KiKii

n

i

i xxxy

推定値は最小2乗法,つまり以下の式を最小にするものとして得られる.

Page 63: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

推定値・残差

パラメータの推定値を次のように表そう.

63

a, b1, b2, b3,, bK

すると各観測の推定値は,

(3.4) ˆ y i ab1 x1i b2 x2i bK xKi

(3.5) ei yi ˆ y i , ei 0i1

n

残差は,

Page 64: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰モデルの選択

ある会社の株価を予想したい.

株価は会社の成長性,安定性,収益性などの要素で決まると言われる.

成長性の指標として,昨年の売上高成長率を採用するのか,それとも,5年間の平均を採用するのか.

あるいは,経常利益を考えるのか?

それとも,両方を採用するか?

64

Page 65: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

回帰モデルの候補は数えきれない

説明変数として何を採用するのか?

説明変数をいくつ採用するのか?

競合する回帰モデルの優劣を示す数値が必要になる.

その一つが,修正決定係数である.

65

Page 66: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

修正決定係数とは?

決定係数はモデルの選択に使えない。

説明変数の数を増やせば,決定係数は必ず増加ずる.

説明変数が多いと有利。

その理由は、下のような2つのモデルを考えてみる。

2

2

2

)(1

1

1

yyn

enR

i

i

66

)2(

)1(

2211

11

iii

ii

xxy

xy

修正前の決定係数

Page 67: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

説明変数が多いと・・・・

)'2()(min 2

2211,,

2

21iiibbai xbxbaye

67

)'1()(min 2

11,

2

1iibai xbaye

このとき、(1’)と(2’)とではどちらが小さいか、考えてみよう。

(2’) が小さくなる。

なぜなら、(2’) では b2=0 と固定したとき、(1’) と同じになるので、この制約を外せば(1’)よりも小さくなることが期待できる。

Page 68: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

修正決定係数の定義:単回帰のとき

22

1

)(min)( ayyy ia

n

i

i

)1()(

)2(1

)1()(

)2()ˆ(1

2

1

2

2

2

1

2

2

nyy

ne

nyy

nyyR

n

i

i

i

n

i

i

ii

2

2

2

)(1

1

1

yyn

enR

i

i

68

)1(11 ii xy

2

11,

2 )(min1 iibai xbaye

Page 69: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

説明変数が一つ増えると,

22

1

)(min)( ayyy ia

n

i

i

2

2

2

)(1

1

1

yyn

enR

i

i

)1()(

)3(1

)1()(

)3()ˆ(1

2

1

2

2

2

1

2

2

nyy

ne

nyy

nyyR

n

i

i

i

n

i

i

ii

69

)2(2211 iii xxy

2

2211,,

2 )(min21 iiibbai xbxbaye

Page 70: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

一般の場合

70

説明変数がK個のときには,下の修正決定係数を用いる.

)1()(

)1(1

)1()(

)1()ˆ(1

2

1

2

2

2

1

2

2

nyy

Kne

nyy

KnyyR

n

i

i

i

n

i

i

ii

22

1

)(min)( ayyy ia

n

i

i

2

2211,,,,

2 )(min21 KiKiiibbbai xbxbxbaye

K

Page 71: 13章回帰分析の基礎 - Kansai U · 13章回帰分析の基礎 2つ以上の変数についての関 係を見る. 1つの変数を結果,その他の 変数を原因として,因果関係

決定係数:回帰による変動の割合

71

決定係数は,説明変数が1つの場合と同様に,以下のように表される.

R2 ( ˆ y i y )2

(yi y i1

n

)21

(yi ˆ y i )2

(yi y i1

n

)21

e2

(yi y i1

n

)2

1e2 n

(yi y i1

n

)2 n

1see

syy