論理生命学第 7 回：潜在変数モデルと EM アルゴリズム

論理生命学第 7 回：潜在変数モデルと EM アルゴリズ

ム

渡辺一帆

内容

潜在変数モデルとは　　例）混合正規分布　　　　隠れマルコフモデル

EM （ Expectation Maximization ）法

　潜在変数モデルの最尤推定のためのアルゴリズム

講義資料： http://hawaii.naist.jp/~wkazuho/index-j.html

混合正規分布（１）

K

kkk xgaxp

1

)|()|( w

Gaussian Mixture Model （ GMM ）

Mk

K

kkkkk Raaa ,1,0|,

1

w 応用）クラスタリング , 密度推定

2

||||exp

2

1)|(

2k

Mk

xxg

M 次元正規分布

コンポーネント：

パラメータ :

1,01

K

kkk aa混合比 :

)1(x

)2(x

)1(x)2(x

.

. .

. .

.

.

.

..

..

.. . ..

. ...

.

.. .

..

.),...,,( 21 Kaaaa は確率ベクトル

MRx

混合正規分布（２）

K

kkk

y

xgayxpxp1

)|()|,()|( ww

K

k

yk

k

xgyxp1

)(

)|(),|( μ

)0,0,1(y

K

k

ykk

k

xgayxp1

)(

)|()|,( w

)}1,...,0,0(...,),0...,,0,1{(),...,( )()1( Kyyy

)0,1,0(y

)1,0,0(y

K

k

yk

k

ayp1

)(

)|( a

どれか一つの要素のみが 1.

潜在変数（隠れ変数、不観測変数）

周辺化

隠れマルコフモデル（１）

1

3

2

ija ：状態遷移確率

状態 i から状態 j へ遷移する確率

imb ：出力確率

状態 i において m を出力する確率

},...,,{ 21 nxxxx

ijaA

imbB

)}1,...,0,0(...,),0...,,0,1{(

),...,( )()1(

M

ttt xxx

データ系列

11

K

jija

11a 22a

12a

31a

11

M

mimb

KK

MK

応用）文字列、時系列のモデリング

Hidden Markov Model (HMM)

13a

隠れマルコフモデル（２）

)0...,,0,1(1 y

1

3

2

簡単のため　　　　　　　　　　　　　（状態１からスタート）

)}1,...,0,0(...,),0...,,0,1{(

),...,( )()1(

K

ttt yyy

K

j

K

i

yyijtt

it

jtaAyyp

1 11

)(1

)(

),|(

K

i

M

m

xyimtt

mt

itbByxp

1 1

)()(

),|(

2

)|,(...)|(y yn

pp wyxwx

n

ttt

n

ttt ByxpAyypp

121 ),|(),|()|,( wyx

周辺化HMM の尤度

),( BAw

演習

混合二項分布（　　　　　　　　　　　は既知）

xNxxNx ppx

Napp

x

Naxp

)1()1()1()|( 2211w

}10,10,10;,,{ 2121 ppappaw について

（１）潜在変数を　　　　　　　　　　　　　　　　　　としてを表せ

)}1,0(),0,1{(),( )2()1( yyy )|,( wyxp

},...,2,1,0{ Nx N

（２）ベイズの定理

により　　　　　　　を表せ),|( wxyp

y

yxp

yxpxyp

)|,(

)|,(),|(

w

ww

最尤推定

学習データ : },...,{ 1 nxxx },...,{ 1 nyyy潜在変数 :

最尤推定量 :

潜在変数モデルでは

EM （ Expectation Maximization ）法 :

　　　　潜在変数モデルの最尤推定のための（効率的な）アルゴリズム

)|( wxp尤度関数 : 　　　

)|(logmaxargˆ wxww

pML

y

wyxwx )|,(log)|(log pp

　混合分布の場合：各　　　は独立と仮定ix

n

i yii

n

ii

i

yxpxpp11

)|,()|()|( wwwx

EM アルゴリズム

1. 　　　　に適当な初期値を与える

w

EM アルゴリズム

w

（密度関数ではない）

)|,(log)~,|()~;( wyxwxywwy

ppQ とする

Q 関数

w~

2. E ステップ：　　　　　　　　を計算

)~;( wwQ

3. M ステップ：　　　　　　　　を最大にする　　　を　　　とする

)~;( wwQ

w4. 　　の対数尤度を計算し、収束しているか判定する

　　収束していなければ、　　　　　　として 2. に戻る

ww ˆ~

準備：カルバック情報量

)(xq

)()( xqxp 0)||( qpK

∵

xが離散のとき

xが連続のとき

)(xp２つの確率分布　　　と　　　　の間の擬距離

x xq

xpxpqpK

)(

)(log)()||(

dxxq

xpxp

)(

)(log)(

　　　　　　　　　　　等号は　　　　　　　　　のときのみ　

dxxp

xq

xq

xpxpqpK 1

)(

)(

)(

)(log)()||(

1log tt

（等号成立は t=1 ）より)(

)(

xp

xqt として

1ty

ty log

t

y

1t

☆ 注意　データ x 上の確率分布間以外にも潜在変数 y 上やパラメータ w 上の確率分布間の距離を測る場合もあります

EM アルゴリズム（２）

yy

wyxwyxw )~|,(log)|,(log)( ppL

（∵ベイズの定理）

EM 法で尤度が増加する理由

y

y

wyx

wyx

)~|,(

)|,(

logp

p

)~,|(/)~|,(

),|(/)|,(log

wxywyx

wxywyx

pp

pp

),|(

)~,|(log

)~|,(

)|,(log

wxy

wxy

wyx

wyx

p

p

p

p

両辺を　　　　　　　で期待値をとると)~,|( wxyp

（言いたいこと　　　　　　　　　　）

0)ˆ( wL

EM アルゴリズム（３）

)(wL

（∵カルバック情報量は非負）

EM 法で尤度が増加する理由（続き）

)),|(||)~,|(()~;~()~;( wxywxywwww ppKQQ

yy wxy

wxywxy

wyx

wyxwxy

),|(

)~,|(log)~,|(

)~|,(

)|,(log)~,|(

p

pp

p

pp

)~;~()~;( wwww QQ

潜在変数の分布に関するカルバック情報量

)~;(maxargˆ wwwww

Q ととれば、 0)ˆ( wL（尤度が必ず増加）

混合正規分布の場合

潜在変数の事後分布

n

i

K

k

y

kiMk

ki

xga

p1 1

)(

)|(2

)|,(

wyx完全尤度 :

n

iii xyp

p

pp

1

),|()|(

)|,(),|( w

wx

wyxwxy

iyii

iiii yxp

yxpxyp

)|,(

)|,(),|(

w

ww

K

llil

K

k

ykik

xga

xgaki

1

1

)|(

)|()(

K

llil

kiki

ki

xga

xgaxyp

1

)(

)|(

)|(),|1(

w ( ＊ )

}2

||||exp{)|(

2ki

ki

xxg

各データは独立

混合正規分布の場合

Q 関数 )|,(log)~,|()~;( wyxwxywwy

ppQ

n

i

K

kkik

ki xgayp

1 1

)( )|(log)~,|( y

wxy

n

i

K

kkiki

ki xgaxyp

1 1

)( )|(log)~,|1( w

n

ii

kik xypn

1

)( )~,|1( w i

n

ii

ki

kk xxypn

1

)( )~,|1(1

w とすると

コンポーネント k からのデータ数コンポーネント k からのデータの平均

K

k

kkkkk anQ

1

2

2

||||log)~;(

ww +(w に依存しない項 )

kk ˆ

n

na kk ˆ

(†) EM 法：

( ＊ ) と (†) を繰り返す

n

ii

kik xypn

1

)( )~,|1( w

応用例）混合正規分布 ( アルゴリズム )

初期化 E ステップ

M ステップ

繰り返す

終了

77.0)~,|1( )2( wii xyp

49.0ˆ1 a

51.0ˆ2 a

49.0~1 a

51.0~2 a

* 　

* *

□ ： data （　　　　　）

*

*

*

*40.0ˆ1 a

60.0ˆ2 a

50nk~

* *

76.0)~,|1( )1( wii xyp

潜在変数モデルの実例　　　混合正規分布　　　隠れマルコフモデル

潜在変数モデルの最尤推定法のためのEM アルゴリズム

まとめ

演習（つづき）

混合二項分布（　　　　　　　　　　　は既知）

xNxxNx ppx

Napp

x

Naxp

)1()1()1()|( 2211w

}10,10,10;,,{ 2121 ppappaw について

（３） n 個のデータ　　　　　　　　　が与えられたときの

　　　 Q 関数　　　　　　　を計算せよ（　　　　を用いて表せ）

},...,{ 1 nxxx

)~;( wwQ

},...,2,1,0{ Nx N

（４） EM 法による尤度最大化のためのアルゴリズムを導け

,kn k

（１）潜在変数を　　　　　　　　　　　　　　　　　　としてを表せ

)}1,0(),0,1{(),( )2()1( yyy )|,( wyxp

（２）ベイズの定理により　　　　　　　を表せ

),|( wxyp

y

yxp

yxpxyp

)|,(

)|,(),|(

w

ww

ヒント

Q の最大化

K

k

kkkkk an

1

2

2

||||log

+(w に依存しない項 )

K

k k

kk

a

nn

n

n

1

/log はカルバック情報量なので非負

0log1

log/

log1 11

K

k

K

kkk

kkK

k k

kk annn

n

n

n

a

nn

n

n

K

k

kk

K

kkk n

nnan

11

loglog （等号成立は　　　　　　　のとき） n

na kk

2

||||

2

||||||||

2

|||| 222

2kk

kkk

kk

（等号成立は　　　　　　　のとき）

kk

)|,(log)~,|()~;( wyxwxywwy

ppQ

Documents

論理生命学第 7 回： 潜在変数モデルと EM アルゴリズム

論理生命学第 7 回：潜在変数モデルと EM アルゴリズム