Upload
moral
View
52
Download
0
Embed Size (px)
DESCRIPTION
量子化学における 超大規模半正定値計画問題と 並列計算による高速求解. 神奈川大学工学部情報システム創成学科 山下真 [email protected] 東京工業大学 Mituhiro Fukuda 東京大学 中田真秀. RAMP 18 th 2006/10/13. Outline. 量子化学の基本的で重要な問題に 基底状態のエネルギー (Ground State Energy) そのときの電子構造 を求めることがある - PowerPoint PPT Presentation
Citation preview
1
量子化学における超大規模半正定値計画問題と並列計算による高速求解
神奈川大学工学部情報システム創成学科
東京工業大学 Mituhiro Fukuda東京大学 中田真秀
RAMP 18th 2006/10/13
2
Outline 量子化学の基本的で重要な問題に
基底状態のエネルギー (Ground State Energy) そのときの電子構造
を求めることがある この問題は、半正定値計画問題
(SemiDefinite Programming, SDP) に緩和できる 並列計算を用いて実用時間内に解くことができる
量子化学+数理最適化+並列計算の3つの分野
4
量子論と SDP( その1:座標回転) まずは、大まかな話から 波動関数と物理量のオペレータの行列表現を
それぞれ とすると、物理量は の2次形式で計算できる
適切な回転行列 を用いると対角行列 で
本質的な量(固有値)と座標回転を同時に考えることが必要
5
量子論と SDP (その 2 :対称行列) 本質的な量(固有値)と座標の回転を同時に
考えることが必要
対称行列で変数の表現 電子構造を対称行列で表現すると、
(直観的には)固有値が電子の個数となる 変数が半正定値行列に制約される 半正定値行列を変数に持つ線形計画問題が
半正定値計画問題
7
基底状態におけるエネルギーとは 直観的には、原子・分子系の
最も安定した状態が基底状態 化学反応で発生するエネルギーなどを
計算するときに必要となるエネルギー
これを求めることは、量子化学における基本的なこと
8
量子力学における定式化 Heisenberg の行列力学
Schrödinger の波動方程式
これらは、 Hilbert 空間の内積が一致するため、物理学的には等価
時間座標と空間座標を変数分離
10
行列表現 水素原子の場合、全空間での電子の数は 1 であ
るため、波動関数は Hilbert 空間 に属している
Hilbert 空間での基底を
とすると、波動関数を展開できる
このとき波動関数 とベクトル を同一視できる
15
Hartree-Fock Self Consistent Field 法で得られた
一電子波動関数 エネルギーの低い順に 基底状態の波動関数を
とする
使用しているのは、のひとつの項のみ
GSE と誤差1%程度とされている
17
CCSD(T) Coupled Cluster expansion using Single and Double
excitations with perturbation treatment of Triples
一次結合 の中で効果の高い項のみで計算
量子化学の分野で信頼されている手法 これと同等の精度を出すことがひとつの目
安
18
SDP による GSE 計算 Full CI 同様に最小固有値の計算をベース Full CI では、 von Neumann 密度行列と同等
必要な情報量は、2次の縮約密度行列のみ
2次の縮約密度行列を変数とすることで計算量を抑える
19
SDP による GSE 計算の歴史(1) 1960 年代: Coleman, Garrod ら
半無限線形計画問題への帰着 SDP緩和
Erdahl による独自のアルゴリズムでの数値実験 SDP 緩和が不十分なため良い結果を得られず
1990 年代:数理最適化の分野で主双対内点法の研究が活発に
20
SDP による GSE 計算の歴史(2) 2001 年:中田ら
主双対内点法のソフトウェアSDPA [SemiDefinite Programming Alogorithm]を用いて計算
P,Q,G 条件などで良好な精度 2004 年 :Zhao ら
T1,T2 条件を導入して精度向上 並列ソフトウェア
SDPARA [SDPA paRAllel version] を使用
21
SDP への帰着 主問題側 へと帰着させる方法と
双対問題側 へと帰着させる方法がある 計算効率は の方がいいが、まずは分かり
やすい へと帰着させる
ハミルトニアンも電子間に相互作用がないところから帰着
23
N-representability 密度行列は N-representability とよばれる条件
を満たす必要がある。1次なら
直観的には、それぞれの波動関数上の電子の数を 0 から 1 に制約していることになる
まとめると、
SDP のひとつだが標準形ではない
26
2次縮約密度行列 電子間相互作用に関するハミルトニアンを組み込
む
この項を計算するために 2-RDM Γ を導入
Γ が波動関数に対応するための必要十分条件もN-representability である
組み合わせ的な要素を含んでいるため、全部の条件を列挙して計算することは不可能
27
P,Q,G 条件の導入 P,Q,G 条件は N-representability の中でも効率的
で効果的に Γ の領域を表現できる それぞれ、次の行列の半正定値条件に対応
P,Q,G 行列は Γ からの線形変換で得られる これらを P,Q,G の半正定値条件を SDP の制約条
件に追加する( SDP 緩和が得られる)
29
2-RDM があるときのSDP のサイズ
2K=28 のときには、単一 CPU 上の SDPA で8.6GB のメモリを使用する
並列計算へと移行する
0
5000
10000
15000
20000
25000
30000
16 18 20 22 24 26 28
30
SDPARA SDPA parallel version
(generic SDP solver) 主双対内点法
PC クラスタ上の分散メモリで超大規模な SDP を格納 並列計算による計算時間の短縮
実装に使用しているライブラリ MPICH (通信用ライブラリ) ScaLAPACK (並列版 LAPACK )
マルチプロセッサ化にともなって、普通の PC でも並列計算が標準の時代に
http://homepage.mac.com/klabtitech/sdpa-homepage/
34
探索方向の計算
Schur complement equation
Schur complement matrix ⇒ Cholesky Factorizaiton
1.ELEMENTS
2.CHOLESKY
35
単一プロセッサ上でのボトルネック
SDPARA でボトルネックを並列化 計算時間の単位は秒Opteron 246 (2.0GHz)
LiOH HF
m 10592 15018
ELEMENTS 6150( 43%) 16719( 35%)
CHOLESKY 7744( 54%) 20995( 44%)
TOTAL 14250(100%) 47483(100%)
37
Row-wise distribution for evaluation of the Schur complement matrix
CPU が 4 個の場合を表示それぞれの CPU は 行方向を担当
. CPU 間の通信は一切なし効率的なメモリ管理
38
並列 Cholesky 分解 Schur complement matrix の Cholesky 分解に
は ScaLAPACK のルーチンを使用 行方向のメモリ管理から2次元巡回配置に分散メモリ
上で再配置して効率的に
再配置
39
分子 LiOH に関する計算時間
14250
3514969
414
61501654
30884
7744
1186357
141
1
10
100
1000
10000
100000
1 4 16 64#processors
second TOTAL
ELEMENTSCHOLESKY
AIST super clusterOpteron 246 (2.0GHz)
6GB memory/node
40
分子 HF の計算時間のスケーラビリティー
1
10
100
1 2 4 8 16 32 64#processors
scalability TOTAL
ELEMENTSCHOLESKY
Total 29 times
ELEMENTS 63 times
CHOLESKY 39 times
ELEMENTS の行方向分割が非常に強力
41
計算時間
一番大きな分子 (NH) にも並列計算は効果 単一プロセッサの場合には、メモリスペースの関係で解くことができない
22 日 ( 単一プロセッサ上の計算時間の予測値 ) → 7 時間に短縮
(単位は秒)
42
数値精度比較 得られた GSE の精度を Full CI からの差で表現す
る 既存手法
HF (Hatree-Fock) CCSD(T) (Coupled Cluster expansion using Single and
Double excitations with perturbation treatment of Triples)
SDP 緩和 (PQG, T1T2)
43
数値精度
PQG は HF よりも精度がよい T1T2 は CCSD(T) とほぼ同等の精度 T1T2 は化学的精度の 1kcal/mol より高い精度
in Hartree (1 Hatree = 4.36x10^(-18) Joule)
44
まとめと今後の展開
GSE計算は SDP緩和に帰着できる SDP緩和は GSE を高い精度で計算できる メモリ消費や計算時間から、並列計算をすることが必要
Hubbard モデルへの適用 双極子モーメントの計算などなど 数値的安定性の向上 メモリ消費の抑制