最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

TSUBAME 2.0 と SDPA, SDPARA その21

2012年04月08日 10時53分35秒 | Weblog
sko42 の問題に対する実験結果について。Cholesky 分解は行列サイズ n の3乗のオーダーだが、この計算の前に4乗オーダーの部分(SCM の生成)がある。ちなみに、この部分は疎性の利用と 2720 CPU の並列計算で 380 秒程度で通過できた。

◯SCM(Schur Complemet Matrix) の生成時間
1360CPU : 487.7s
2720CPU : 388.3s
◯SCM の Cholesky 分解の計算時間
2040 GPU : 3348.5s (343TFlops)
4080 GOU : 2045.0s (533TFlops)

◯問題名 : sko42.dat-s (QAP に対する DNN 緩和問題)
mDIM = 1484406
nBLOCK = 2
bLOCKsTRUCT = -1777522 1682

◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel Xeon 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps

◯1ノードあたりの性能(倍精度)
CPU 140GF(2.93GHz) + GPU 1545GF = 1685GF
CPU 153GF(3.2GHz : TB) + GPU 1545GF = 1698GF
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 第12世代Dell PowerEdgeサーバ | トップ | iPad で Linpack »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事