最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA 7.3.1 と SDPARA 7.3.1

2009年07月08日 00時34分28秒 | Weblog
もうすぐ SDPA 7.3.1 と SDPARA 7.3.1 の正式版をリリースする予定である。コアとなる部分(アルゴリズム)は両者で共通化されている。もう少しデバッグやパフォーマンスチューニングを行う必要がある。

1: SDPA 7.3.1 は 7.3.0 よりも性能的には少し上がっているが、その他にもバグ fix やメモリリークの解消などが行われている。SDPA 7.3.1 は GotoBLAS などと適切に組み合わせることにより、他の SDP ソフトウェアよりもかなり優れた性能を示す

2: SDPARA は 7.3.0(7.3.1β) と 7.3.1 では後者の方が F3 式の計算時間がかなり減少している。階層化とマルチスレッド計算で F3 式がボトルネックなる件はかなり改善されているので、これからは Parallel Cholesky Factorization がボトルネックになる場合が多くなってくるだろう。


問題1: N.4P.DZ.pqgt1t2p.dat-s

SDPARA 7.3.1 : 635.8(39反復)
SDPARA 7.3.0 : 1358.5s(39反復)
SDPARA 7.2.1 : 2113.1s(39反復)
PCSDP 1.0 : 1958.8s(36反復)

F3式の計算時間は
SDPARA 7.3.0 : 1057.64秒 (77.95%)
SDPARA 7.3.1 : 350.99秒 (55.37%)
と激減した。

問題2: HLi2.2A1.STO6G.pqgt1t2p.dat-s

SDPARA 7.3.1 : 1759.4s(41反復)
SDPARA 7.3.0 : 4955.4s(41反復)

これもF3式の計算時間は
SDPARA 7.3.0 : 4291.60秒 (86.66%)
SDPARA 7.3.1 : 1097.12秒 (62.47%)
と激減した。

実験は以下のクラスタで全て 32 ノード(MPI) x 4 スレッド(pthread + GotoBLAS) で動作させた。

○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
HDD : 6TB(RAID 5) / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.3 for x86_64
コメント (3)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« It\'s Lucie! | トップ | SDPARA 7.3.1 と水分子 »
最新の画像もっと見る

3 コメント

コメント日が  古い順  |   新しい順
Unknown (NakataMaho)
2009-07-06 18:46:28
すばらしいとしかいいようがない結果ですね。
返信する
Unknown (NakataMaho)
2009-07-06 18:46:54
高速化本当にありがとうございます。

返信する
Unknown (FujisawaKatsuki)
2009-07-06 21:57:05
今一番大きな水分子(H2O)の問題も解いています。上記の結果は 32(MPI)x4(スレッド)ですが、どうも16(MPI)x8(スレッド)の方が速いようです。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事