36
1 アンサンブルカルマンフィルターによ る大気海洋結合モデルへのデータ同化 データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ推定法 上野玄太 (統計数理研究所) 1. 状態空間モデル 2. 観測ノイズ分散共分散 行列の推定

データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

1

アンサンブルカルマンフィルターによる大気海洋結合モデルへのデータ同化 データ同化モデルにおける観測ノイズ分散共分散行列のベイズ推定法

上野玄太 (統計数理研究所)

1. 状態空間モデル

2. 観測ノイズ分散共分散行列の推定

Page 2: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

2

準備:状態空間モデル

•以上の2つをそれぞれシステムモデル、観測モデルと呼び、それらを合わせて状態空間モデルという。データ同化の基本となるモデルである。

•シミュレーションモデルでは思うように現象が再現・予測できない。このとき、シミュレーションモデルに「遊び」を許し、観測データの情報を取り込める自由度を持ったものへと拡張する。

•シミュレーションモデルと観測データの間にも自由度を持った関係を構築する。

•シミュレーションモデルでは思うように現象が再現・予測できない。そのため、シミュレーションモデルの大規模化・精緻化・階層化などを進める

[いわゆる「演繹一本槍」]

Page 3: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

3

シミュレーション (1/2)

x の時間発展を与える微分方程式

txgdt

dx,

fupuut

u

21

tt

xgt

xtxt ,1

1

離散化

collt

f

v

f

m

F

x

fv

t

f

1:

,11

tx

tf

ttt

xgxtxt移項

Page 4: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

4

シミュレーション (2/2)

シミュレーションモデル

Ttxtf txt ,,2,1,1

•x :シミュレーション変数をまとめたベクトル量で、状態もしくは状態ベクトルと呼ぶ。

•x0: 初期状態もしくは初期条件と呼ぶ。シミュレーションの計算の前にあらかじめ与える

上の設定から当たり前のことではあるが、

初期状態 x0 を与えると、その後の状態の列

(x1, x2, …, xT) が一意に決まる。

Page 5: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

5

時間発展の不確定性、システムノイズ

Ttxtf txtxtf txt ,,2,1,11

Ttt

vxtf txt ,,2,1,1

近似等号を表現するために、付加項 vt を含めて

等号で結ぶ:

付加項 vt の確率分布を仮定する:

Ttt

vpt

v ,,2,1,~

vtをシステムノイズと呼ぶ。

Page 6: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

6

システムモデル

シミュレーションモデル

Ttxtf txt

xx

,,2,1,1

100

システムモデル

初期条件はこのあたりか?

時間発展はこんなものか?

初期条件はこうだ!

時間発展はこうだ!

Ttt

Qt

vpt

v

Ttt

vxtf txt

Vxxpx

,,2,1,;~

,,2,1,1

0,1

0;

0~

0

初期状態の確率分布

システムノイズの確率分布

x0

xp 0

1

0x

0V

Page 7: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

7

モデルとデータのつき合わせ

状態

次元ベクトルの列k

Ttxt ,,2,1,

観測データ

次元ベクトルの列l

Ttt

y ,,2,1,

状態は多くの変数を要素に持つベクトルであるが、

実際に観測されるのは一部の変数である (l < k)。

つき合わせたい

xt yt

xt yt広瀬・万田

(2006)

Page 8: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

8

観測モデル、観測ノイズ

考え方:得られた状態は観測と近い

Ttt

xt

ht

y ,,2,1,

Ttt

Rt

wpt

w ,,2,1,;~

付加項 wt の確率分布を仮定する:

wtを観測ノイズと呼ぶ。

近似等号を表現するために、付加項 wt を含めて

等号で結ぶ:

Ttt

wt

xt

ht

y ,,2,1,

観測モデル

Page 9: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

9

観測ノイズ

•観測ノイズ wt の定義は、 観測とモデルの差 yt-ht(xt)

•観測機器の特性に起因する、いわゆる「測定誤差」は、観測ノイズに寄与する要素の一部と考えるべき

[観測ノイズ、という言葉から類推しないでください]

•極端な例として、観測ノイズと「測定誤差」が一致する場合を考えると、モデルが観測機器をとりまく自然現象を完璧に再現できる場合に対応

•通常はモデルにはそこまでの能力はないため、モデルが再現し切れない部分も差としてカウントされる

Page 10: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

10

状態空間モデル

システムモデル、観測モデルからなるモデルを

状態空間モデルと呼ぶ。

Ttt

Qt

vpt

v

Ttt

vxtf txt

Vxxpx

,,2,1,;~

,,2,1,1

0,1

0;

0~

0

システムモデル

Tt

tR

twp

tw

Ttt

wt

xt

ht

y

,,2,1,;~

,,2,1,

観測モデル

(狭い意味で)データ同化では、初期状態の確率分布、システムノイズの確率分布、観測ノイズの確率分布を与えたときに、観測データに基づいて、状態の確率分布を求める。

Page 11: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

11

データ同化における状態空間モデル

• データ同化 = 状態変数 を推定する問題

– : タイムステップ t でのシミュレーションの全変数を

まとめたベクトル (x0: 初期条件)

– : タイムステップ t での観測される全変数

– : システムノイズ. シミュレーションの不確定部分を表現 する確率変数 (不確定部分: 境界条件、パラメータ、 …)

– : 観測ノイズ

ty

tx

tv

tw

tx

t

xt

ht

y

tx

tf

tx

)

1(

t

wt

xt

ht

y

tv

tx

tf

tx

)1

((システムモデル)

(観測モデル)

変数の次元 tx : 104~106 : 102~105 )dim()dim( tt yx ty

Page 12: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

,

0

~ 0,

~ 0,

~0 | 0 0 | 0

v N Q

w N

t t

t t

N V

R

x x

12

データ同化における共分散行列

,1

f x vt t t t

y h x wt t t

x

t

状態空間モデル

共分散行列

Qt小 → モデルよりの状態推定値

Rt小 → データよりの状態推定値

V0|0小 → x0|0 よりの初期値

• θ = (V0|0, Q1:T, R1:T) の

最尤推定 初期値

システム

ノイズ

観測

ノイズ

システムモデル

観測モデル

Page 13: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

13

データ同化結果

Q大

sh大)

R大

(a大) どれがいいのか?

Page 14: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

尤度とは

与えられた観測値 yobs が得られるような、

一番もっともらしい確率分布はどれか?

もっともらしさ = 尤度 L(t) = p(yobs|θ)

上の例では q3 が一番もっともらしい。

|1

p y q |2

p y q |3

p y q

yobs yobs yobs

Page 15: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

, , , |1 2

, , ,| | , | , , | ,1 21 2 1 3 1 2 1

| ,1: 11

L p y y yT

yy yp p p py y y y y y yT T

Tp y yt t

t

q q

q q q q

q

時系列の尤度

この量を最大とするようなθを求める。

実際上は、対数を最大とするようにすると扱いやすい。

log1:

| ,1:

|

g

11

loT

p

p yT

y yt t

t

q

q q

Page 16: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

時系列の尤度

log

1

lo

| ,1: 1

| , | ,1

1: 1

g

Tp y y

t t

p y x x y dxt t t

t

T

tp

tt

qq

q q

観測モデルから決まる

予測分布

,H xt t t

N R,

f fxt

Pt

N ~ 0,

y H wt t t t

w Nt t

x

R

一般にガウス分布ではない

[力学モデルが非線型なので]

でもガウス

だと思うと

尤度

Page 17: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

17

分布のアンサンブル近似

アンサンブルカルマンフィルタ (EnKF),

粒子フィルタ (PF)

非ガウス分布

アンサンブル

近似/粒子近似

xt

xt V jtx jtN |,|

x jt |

V jt |xt

ガウス分布

厳密に

表現可能

カルマンフィルタ (KF)

Page 18: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

シミュレーションの抽象的表現

18

x : 状態

x1

x2

x3

ある時点での全格子点上の

全物理量をまとめて表すベクトル

t : 時刻 t =1 t =2 t =3 t =0

xt=f(xt-1) シミュレーションによる状態の時間発展

初期値 x0

Page 19: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

アンサンブル予測

19

x1(1)= f1(x0

(1)) x2

(1)= f2(x1(1)) x0

(1) x3(1)= f3(x2

(1))

x2(2)

x0(2) x1

(2) x3

(2)

x0(3)

x0(4) 異なる初期値で

シミュレーションを実施

Page 20: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

アンサンブル型データ同化

20

x0(1)

y1

y2

データ同化 データ同化

データに応じて、アンサンブルを改変

• アンサンブルカルマンフィルタ (EnKF),

• 粒子フィルタ (PF)

Page 21: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

21

EnKF と PF

x tt)1(

1|1

x tt)1(

1|

x tt)1(|

リサンプリング

y t

x tt)1(

1|1

x tt)1(

1|

x tt)1(|

近似カルマンゲイン

y t

x ntt

ytp )(1|

|

EnKF PF

xt 1 xt xt

KF

| | 1 | 1

n n n nyx x w xHK tt ttt t t t t t

1

| 1 | 1 | 1V H H V H RK t t t t t t t t t t

Page 22: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

22

問題意識

•状態推定の結果は、あらかじめ設定した θ によって、いかようにもできる (正則化パラメータと同様)

•θ = (V0|0, Q1:T, R1:T)

V0|0 : 初期状態の分散共分散行列 (Bと書くことあり)

Qt: システムノイズの分散共分散行列

Rt: 観測ノイズの分散共分散行列

•なるべくデータの情報を取り込む設定に興味がある

•グリッドサーチ(総当たり)、リサンプリング

計算が大変

探索範囲にどうしても限界がある (候補を自分で用意するため)

Page 23: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

23

尤度のアンサンブル近似

|

dim 1log 2 log

2 21

1 1log exp log| 1 | 121

log1:

T ytRt

t

N n nNy yh x h xRt ttt

p yT

tt t t tn

q

q

尤度は各アンサンブルメンバー xt|t-1(n) の尤度の平均

で近似できる

( )

~ 0,

y h x wt t t

wt

t

N Rt

• この量 (対数尤度) を最大化するθ を求める。

Page 24: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

24

観測誤差共分散行列の尤度

今回 , ,1: 1: 1:

B Q R RT T T

q のうち、 のみに着目 

, , ,1: 1 2

R R R RT T

, ,1 :

12

,1

R RT t

t

Rt

TR

対数尤度

Rt

1: 1R

t

,1: 1t t

R R

dim 1log 2 log

2 2

1 1log exp| 1 | 12

1:

1

log

ytRt

N n ny yh x h xRt ttt tt t t t

Rt t

n

N

但し 

Page 25: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

25

推定の方針

• ℓt(R1:t) は Rt の推定のためだけに用いる • 本来は R1:t-1 もパラメータだが、これらは過去の対数尤度 ℓ1(R1),

…, ℓt-1(R1:t-1) で推定され、現時点では固定とする • 各時点tで、 Rtが推定される

• 各時点で yt に応じてRt を推定するので、ばたばたするかも • 時点に依存しない一定の R を推定することは できない

Rt

1: 1R

t

,1: 1t t

R R

dim 1log 2 log

2 2

1 1log exp| 1 | 12

1:

1

log

ytRt

N n ny yh x h xRt ttt tt t t t

n

R

N

t t

• これで最尤推定ができる。のだが、

Page 26: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

26

観測誤差共分散行列のベイズ推定

•動機その1:

最尤推定では、 Rt がスカラー倍か対角の場合でしか

うまくいかない。本当は非対角(理想は全成分) Rt

の推定がしたい。

•動機その2:

Rt が激しく時間変化するというのはいかがなものか

•Rt に事前分布を与えたベイズ推定へ

Page 27: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

27

ベイズ推定

尤度 (今まで)

事後分布

| ,

1 1

1; ,

| 1:1

t

N np y h x Rtt t

y R ytNt t

nt

| | , |1: 1: 1 1: 1

|1

; ,| 1

11: 1

p p

N ny h

R y y R y p R yt t t t t t t

p R yt t

x Rtt ttn

tN

事前分布 尤度

Page 28: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

28

EMアルゴリズム

E ステップ

M ステップ

•対数事後分布の最適性条件

log | , ,1:

0p R y S

t t

Rt

標本共分散と事前共分散の線型和

; ,| 1

; ,| 1

11

| 1 |

1

11

1

t

t

n ky h x

t t t tk

n n ky h x

t t t t

Nk k n nR z y h x y h x

t n t t t

R

zN

t t t t tn

S

R

m

m

n

where

Page 29: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

29

データとシミュレーション

経度

色は海面高度の変動を示している

dim 503

0 503 3:5t

yt

R

行列

Page 30: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

30

最尤推定値 [いかがなものか]

Rt t

a , ,1

diag rR rt m

分散

•いずれも、1998年あたりで大

•平均値はいずれも40cm2

•at は振幅小、diag rt は振幅大

1992- 年 -2002

Page 31: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

31

ベイズ推定値 (事前重み 0.95)

• ばたばた感は解消

• 事前情報に重み0.95

ˆ,1

St t t

R a a

, ˆ1

diag r S diagR rt t t

分散

1992- 年 -2002

• 小さめ

Page 32: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

32

ベイズ推定値 (事前重み推定)

• ばたばた感は解消

• 事前情報に重み

ˆ,1

St t t

R a a

, ˆ1

diag r S diagR rt t t

分散

1992- 年 -2002

• 小さめ

Page 33: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

33

ベイズ推定値 (全要素推定)

分散

共分散

Page 34: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

34

平滑化推定値 (Rt: 最尤推定)

Rt t

a diagRt t

r

経度

Page 35: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

35

平滑化推定値 (Rt: ベイズ推定)

ˆ,1

St t t

R a a

, ˆ1

diag r S diagR rt t t

• ばたばた感が解消した分、データへの追従も抑制気味

Page 36: データ同化モデルにおけ る観測ノイズ分散共分散 行列のベイズ …wtk.gfd-dennou.org/2012-12-18/ueno/pub/20121218_ueno.pdf · 行列のベイズ推定法

36

まとめ

• 観測ノイズの共分散行列 Rt のベイズ推定

• 全成分を推定することが可能

• 時間変化を滑らかにすることが可能

• EMアルゴリズムを構成 [最尤推定の場合と同様]

• 事前分布のパラメータは直前推定値、経験値、周辺尤度などから

• エルニーニョモデルを用いた数値実験

• 必要な反復回数は5,6回程度