最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

SDPA の数値実験 2009 年 3 月 その3

2009年03月31日 03時26分56秒 | Weblog
疎な SDP だと性能限界というのがわかりにくいので、どこまで速くなればいいのかというのは判断が難しい。例えば量子化学の SDP を解いてみる。各ソフトウェアで実行すると以下のようになる。

1: SDPA 7.2.1 ; 115.8s
2: SDPA 7.3.0 ; 22.7s
3: CSDP 6.0.1 ; 29.4s
4: SDPT3-4.0β ; 145.9s
5: SeDuMi 1.2 ; 61.2s

さらに細かく調べると F3 式の計算時間が大幅に減っていることがわかる。確証はないのだが、これ以上大きく計算時間を減らすのは難しいかもしれない(多少の改善は可能だろう)。

○F3 式の計算時間
SDPA 7.2.1 ; 108.0s
SDPA 7.3.0 ; 21.0s

○: SDPA 7.3.0 : GotoBLAS 1.30b9 + MUMPS 4.8.3
○: CSDP 6.0.1 : GotoBLAS 1.30b9
○: SDPT3-4.0β : MATLAB : 7.7.0.471 (R2008b) + Intel MKL + CHOLMOD
○: SeDuMi 1.2 : MATLAB : 7.7.0.471 (R2008b) + Intel MKL + CHOLMOD

○実行マシン:Intel Xeon 5460 (3.16GHz) : メモリ 48GB : CentOS 5.2 for x86_64 (8コア使用 : OMP_NUM_THREADS=8)
ジャンル:
ウェブログ
コメント (2)   この記事についてブログを書く
この記事をはてなブックマークに追加
« SDPARA の改造 その3 | トップ | マシンこの10年 »
最近の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
Unknown (後藤)
2009-03-16 23:47:10
F3式においてスレッドを使うと性能が向上するということは、CPUがボトルネックになっているということですが、これは「F3式はメモリバンド幅に依存する」ということと矛盾しませんか?
Unknown (藤澤)
2009-03-18 01:42:17
確かにご指摘の通りで、F3式は A_i と A_j の非零要素の数でデータ移動量も計算量も変動しますので、非零要素の数が少ないときにはメモリバンド幅に依存しないと思います。反対に非零要素の数が多くなるとバンド幅に依存していくるのかもしれませんが、その辺も調べてみます。

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事

トラックバック

この記事のトラックバック  Ping-URL
ブログ作成者から承認されるまでトラックバックは反映されません。