PRML読書会復々讐レーン 5.2 ネットワーク訓練
2012/11/03
Presented by takmin
5.2節の概要
ニューラルネットワークのパラメータwを求めたい!
誤差関数E(w)を最小化するwを求める。
・・・
・・・ ・・・
)1(w
)2(w
5.2節の概要
• 5.2 ネットワーク訓練
–誤差関数E(w)を定義する
• 5.2.1 – 5.2.3
– E(w)を最小化するためのアプローチ/条件/注意点
• 5.3 誤差逆伝播
– E(w)を最小化するアルゴリズム
5.2節の概要
• 5.2 ネットワーク訓練
–誤差関数E(w)を定義する
• 5.2.1 – 5.2.3
– E(w)を最小化するためのアプローチ/条件/注意点
• 5.3 誤差逆伝播
– E(w)を最小化するアルゴリズム
5.2節の目的
• 以下の5つのケースについて、誤差関数、及びその出力ユニット活性における勾配を定義する。
–回帰問題
• 1次元
• 多次元
–識別問題
• 2クラス
• 2クラス×K
• 多クラス
回帰問題(1次元)
)1(w
)2(w
x y tε
連続値 (推定値)
ノイズ
観測値
・・・
・・・
)),,(|(),|( 1 wxwx ytNtp
)),,(|(),|( 1 wxwx ytNtp
回帰問題(1次元)
)1(w
)2(w
x y tε
連続値 (推定値)
ノイズ
観測値
・・・
・・・
)2(w
M
j
jj zwa0
)2(
jza
y
ay
回帰問題(1次元)
)),,(|(),|( 1 wxwx ytNtp (5.12)
回帰問題(1次元)
Nttt ,,, 21 t NxxxX ,,, 21
学習データ
N
n
nntpp1
),,|(),,|( wxwXt
尤度を最大化するパラメータwを求める
回帰問題(1次元)
Nttt ,,, 21 t NxxxX ,,, 21
学習データ
負の対数尤度を最小化するパラメータwを求める
N
n
nntpp1
),,|(ln),,|(ln wxwXt
N
n
nn ytN1
1)),,(|(ln wx
回帰問題(1次元)
N
n
nn ytNp1
1)),,(|(ln),,|(ln wxwXt
N
n
nn yt1
22
1
)(2
exp2
ln
N
n
nn yt1
2)(22
ln2
1
2ln
2)(
2 1
2 Nyt
N
n
nn
回帰問題(1次元)
負の対数尤度を最小化するパラメータwを求める
2ln
2),(
2
),,|(ln
1
2 Nty
p
N
n
nn wx
wXt
(5.13)
N
n
nn tyE1
2),(
2
1)( wxw (5.14)
wに依存しない
誤差関数E(w) を最小化する
回帰問題(1次元)
負の対数尤度を最小化するパラメータβ を求める
2ln
2),(
2
),,|(ln
1
2 Nty
p
N
n
nn wx
wXt
(5.13)
回帰問題(1次元)
負の対数尤度を最小化するパラメータβ を求める
2ln
2),(
2
),,|(ln
1
2 Nty
p
N
n
nMLn
ML
wx
wXt
(5.13)
誤差関数E(w) を最小化するw = wML
回帰問題(1次元)
0),,|(ln
MLp wXt
02
ln2
),(2 1
2
Nty
N
n
nMLn wx
02
),(2
1
1
2
Nty
N
n
nMLn wx
N
n
nMLn
ML
tyN 1
2),(
11wx
回帰問題(1次元)
負の対数尤度を最小化するパラメータβ
(5.15)
N
n
nMLn
ML
tyN 1
2),(
11wx
回帰問題(1次元)
誤差関数の出力ユニット活性 での勾配
2),(
2
1)( ty
aE
awxw
ty
)2(w
jz
ay
ay
a
回帰問題(1次元)
• まとめ
– 誤差関数
– ノイズの分散
– 誤差の勾配
N
n
nn tyE1
2),(
2
1)( wxw (5.12)
N
n
nMLn
ML
tyN 1
2),(
11wx
(5.15)
tyEa
)(w
回帰問題(多次元)
・・・
・・・ ・・・ x y tε
ノイズ
)1(w
)2(w 連続値
(推定値) 観測値
)),,(|(),|( 1Iwxytwxt
Np (5.12)
各次元が独立/同じ分散
回帰問題(多次元)
・・・
・・・ ・・・ x y tε
ノイズ
)1(w
)2(w 連続値
(推定値) 観測値
)),,(|(),|( 1Iwxytwxt
Np (5.12)
各次元が独立/同じ分散
)2(w
M
j
jkjk zwa0
)2(
jz
kaky
kk ay
・・・
・・・
回帰問題(多次元)
N
n
nnNp1
1 )),,(|(ln),,|(ln IwxytwXt
N
n
nn
K
1
22
2exp
2ln yt
N
n
nn
K
1
2
22ln
2yt
2ln
22 1
2 NKN
n
nn
yt
演習5.2
回帰問題(多次元)
負の対数尤度を最小化するパラメータwを求める
2ln
22
),,|(ln
1
2 NK
p
N
n
nn
yt
wXt
N
n
nnE1
2),(
2
1)( twxyw
wに依存しない
誤差関数E(w) を最小化する
回帰問題(多次元)
負の対数尤度を最小化するパラメータβ を求める
N
n
nMLn
ML NK 1
2),(
11twxy
2ln
22
),,|(ln
1
2 NK
p
N
n
nn
yt
wXt
0),,|(ln
wXtp
回帰問題(多次元)
誤差関数の出力ユニット活性 での勾配
2),(
2
1)( kk
kk
tya
Ea
wxw
kk ty
)2(w
jz
kaky
kk ay
ka
回帰問題(多次元)
• まとめ
– 誤差関数
– ノイズの分散
– 誤差の勾配
N
n
nnE1
2),(
2
1)( twxyw
N
n
nMLn
ML NK 1
2),(
11twxy
(5.17)
kk
k
tyEa
)(w
識別問題(2クラス)
)1(w
)2(w
x y t
判別値 (0 or 1)
tt yytp
1
),(1),(),|( wxwxwx (5.12)
・・・
・・・
jz
出力 (0 ~1)
閾値
識別問題(2クラス)
)1(w
)2(w
x y t
判別値 (0 or 1)
tt yytp
1
),(1),(),|( wxwxwx (5.12)
・・・
・・・
jz
出力 (0 ~1)
閾値
)2(w
M
j
jj zwa0
)2(
jza
y
)exp(1
1
)(
a
ay
(5.19)
識別問題(2クラス)
)1(w
)2(w
x y t
判別値 (0 or 1)
tt yytp
1
),(1),(),|( wxwxwx (5.12)
・・・
・・・
jz
出力 (0 ~1)
閾値
)2(w
M
j
jj zwa0
)2(
jza
y
)exp(1
1
)(
a
ay
識別問題(2クラス)
尤度
N
n
t
n
t
nnn yyp
1
1),(1),(),|( wxwxwXt
負の対数尤度=誤差関数
N
n
nnnn ytyt
pE
1
1ln)1(ln
),|(ln)( wXtw
(5.21)
交差エントロピー誤差関数
識別問題(2クラス)
誤差関数の出力ユニット活性 での勾配
ytyta
Ea
1ln)1(ln)(w
ty
)2(w
jz
ay
)(ay
a
識別問題(2クラス)
演習5.6
ytyta
Ea
1ln)1(ln)(w
)(ay )1( yya
y
(4.88)
ytyt )1()1(
a
y
yt
a
y
yt
1
1)1(
1
より
ty
識別問題(2クラス)
• まとめ
–誤差関数
–誤差の勾配
N
n
nnnn ytytE1
1ln)1(ln)(w (5.21)
tyEa
)(w
交差エントロピー誤差関数
識別問題(2クラス×K)
・・・
・・・ ・・・ x
kt
閾値
)1(w
)2(w
ky
K
k
t
k
t
kkk yytp
1
1),(1),(),|( wxwxwx (5.22)
識別問題(2クラス×K)
・・・
・・・ ・・・ x
kt
閾値
)1(w
)2(w
ky
K
k
t
k
t
kkk yytp
1
1),(1),(),|( wxwxwx (5.22)
)2(w
M
j
jkjk zwa0
)2(
jz
kaky
)exp(1
1
)(
k
kk
a
ay
(5.19)
識別問題(2クラス×K )
尤度
N
n
K
k
t
nk
t
nknknk yyp
1 1
1),(1),(),|( wxwxwXt
負の対数尤度=誤差関数
N
n
K
k
nknknknk ytyt
pE
1 1
1ln)1(ln
),|(ln)( wXtw
(5.21)
交差エントロピー誤差関数
識別問題(2クラス×K )
K
k
kkkk
kk
ytyta
Ea 1
1ln)1(ln)(w
kk ty
)2(w
jz
a ky
)( kk ay
誤差関数の出力ユニット活性 での勾配 ka
識別問題(2クラス×K )
• まとめ
–誤差関数
–誤差の勾配
N
n
K
k
nknknknk ytytE1 1
1ln)1(ln)(w (5.23)
kk
k
tyEa
)(w
交差エントロピー誤差関数
識別問題(多クラス)
・・・
・・・ ・・・ x
)1(w
)2(w
y
出力
Ky
y
1
11
K
k
ky
識別問題(多クラス)
・・・
・・・ ・・・ x
)1(w
)2(w
y t
判別値 (1 of K)
出力
閾値
T]0,,1,,0[ t
識別問題(多クラス)
・・・
・・・ ・・・ x
)1(w
)2(w
K
k
t
kkyp
1
),(),|( wxwxt
y t
判別値 (1 of K)
出力
閾値
識別問題(多クラス)
・・・
・・・ ・・・ x
)1(w
)2(w
K
k
t
kkyp
1
),(),|( wxwxt
y t
判別値 (1 of K)
出力
閾値
)2(w
M
j
jkjk zwa0
)2(
jzka
ky
j
j
kk
a
ay
)exp(
)exp(
(5.25)
ソフトマックス関数
識別問題(多クラス)
尤度
N
n
K
k
t
nknkyp
1 1
),(),|( wxwXt
負の対数尤度=誤差関数
N
n
K
k
nknk yt
pE
1 1
),(ln
),|(ln)(
wx
wXtw
(5.25)
識別問題(多クラス )
K
k
kk
kk
yta
Ea 1
),(ln)( wxw
kk ty
)2(w
jz
kaky
j
j
kk
a
ay
)exp(
)exp(
誤差関数の出力ユニット活性 での勾配 ka
識別問題(多クラス)
演習5.7
)( kjkj
k
jyy
a
y
(4.107)
K
j
kjkj
j
j yyy
t1
)(1
より
K
j
jj
kk
yta
Ea 1
),(ln)( wxw
j
j
kk
a
ay
)exp(
)exp(
K
j k
j
j
ja
y
yt
1
1
識別問題(多クラス)
演習5.7 (続き)
K
j
jkkj yt1
)(
K
j
kjkj
j
j
k
yyy
tEa 1
)(1
)( w
K
j
jkj
K
j
jk tty11
kk ty
識別問題(多クラス )
• まとめ
–誤差関数
–誤差の勾配
N
n
K
k
nnknk ytE1 1
),(ln)( wxw (5.24)
kk
k
tyEa
)(w
まとめ
• 回帰問題及び識別問題について、誤差関数を負の対数尤度で定義
• 各ニューロンにおける誤差関数の出力ユニット活性による勾配は、回帰問題でも識別問題でも以下のようにかける。
kk
k
tyEa
)(w (5.18)
誤差関数まとめ
回帰問題
1次元
多次元
識別問題
2クラス
2クラス×K
多クラス
N
n
K
k
nnknk yt1 1
),(ln wx (5.24)
N
n
K
k
nknknknk ytyt1 1
1ln)1(ln (5.23)
N
n
nnnn ytyt1
1ln)1(ln (5.21)
N
n
nn
1
2
2
1ty
N
n
nn ty1
2),(
2
1wx (5.12)
以上!