最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

スパコンでの実験計画 その2

2013年03月21日 01時02分56秒 | Weblog
以下の巨大な SDP だが、最新のプログラム(SDPARA)を TSUBAME 2.0 の 400ノード(4800コア)で実行した場合には、最もボトルネックとなる ELEMENTS の部分の実行が1反復あたり 153.72 秒程度で終了する。16ノード時の実行時間が約 3359.61秒なので、16ノードから400ノード(つまりノード数 25 倍)で 21.85 倍の高速化となっている。

◯ELEMENTSの実行時間 = 153.72 秒/反復 : 400ノード(4800コア)

◯解いた問題 (SDP)
47688 = mDIM
22 = nBLOCK
16 16 16 16 120 120 256 120 120 256 512 256 256 560 1920 1920 560 6032 6032 1920 1920 -554 = bLOCKsTRUCT

◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel X5670 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps

定義:
1. n : SDP の変数と定数行列の大きさ(図2)
2. m : SDP の主問題における制約式の数(図2)
3. # nonzero : 定数行列Ai(i = 0, . . . ,m) における非零要素の総数
4. SCM: 線形方程式系の左辺係数行列(サイズは m x m)
5. ELEMENTS : 係数行列(SCM)の全要素の計算(主要なボトルネックの一つ目)
6. CHOLESKY : 係数行列(SCM)のCholesky 分解(主要なボトルネックの二つ目)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする