最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

SDPARA の改造 その3

2009年03月30日 14時54分24秒 | Weblog
SDPARA 7.2.1 から SDPARA.7.2.1.rev8 へ改良していく過程で、SDPA 7.2.1.rev8 と同じように Schur complement 行列の計算をマルチスレッド化してあるので(多少異なるが基本的にはやり方は同じ)、以下のプロセスとスレッドの数の組合せにおける結果に変化が起きている。
以下はほんの一例だが、合計で 128 コア使用する場合でも SDPARA 7.2.1.rev8 ではプロセス数を減らしてスレッド数を多めにした方が良いことがわかる。他の例題でも 16x8, 32x4 の方が 64x2 や 128x1 よりも速くなることが多いが、これはマルチスレッド化が良い影響を与えているということでもある。いずれはさらに巨大なスパコンでの動作も予定している。

1: 16 プロセス x 8 スレッド
SDPARA 7.2.1 : 12.905s
SDPARA 7.2.1.rev8 : 11.226s

2: 32プロセス x 4 スレッド
SDPARA 7.2.1 : 11.547s
SDPARA 7.2.1.rev8 : 12.104s

3: 64プロセス x 2 スレッド
SDPARA 7.2.1 : 18.984s
SDPARA 7.2.1.rev8 : 15.844s

4: 128プロセス x 1 スレッド
SDPARA 7.2.1 : 47.441s
SDPARA 7.2.1.rev8 : 46.186s

○実験データ
mDIM = 6910
nBLOCK = 1
bLOCKsTRUCT = 1001
thetaG51.dat-s

○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
HDD : 6TB(RAID 5) / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.2 for x86_64
Linpack : R_max = 1.435TFlops, R_peak = 1.618TFlops, R_max / R_peak = 88.69%
ジャンル:
ウェブログ
コメント   この記事についてブログを書く
この記事をはてなブックマークに追加
« Atom 対 Celeron (Coppermine) | トップ | SDPA の数値実験 2009 年 3 ... »
最近の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事

トラックバック

この記事のトラックバック  Ping-URL
ブログ作成者から承認されるまでトラックバックは反映されません。