最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

SDPARA の改造 その2

2009年03月04日 03時33分31秒 | Weblog
SDPARA 7.2.1 では以下のクラスタ計算機において 128 コア全部使用すると 64 コア使用よりも遅くなる現象があったが、SDPARA 7.2.1.rev7 では MPI + pthread を組み合わせて以下のように改善することに成功した。64プロセス x 2 スレッドが速そうである。

1: 32プロセス x 2 スレッド
8m17.669s

2: 32プロセス x 4 スレッド
7m10.009s

3: 64プロセス x 1 スレッド
7m55.803s

4: 64プロセス x 2 スレッド
7m2.821s

5: 128プロセス x 1 スレッド
8m51.216s

○実験データ
mDIM = 24503
nBLOCK = 3
bLOCKsTRUCT = 153 153 324
CH4.1A1.STO6G.noncore.pqg.dat-s

○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
HDD : 6TB(RAID 5) / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.2 for x86_64
Linpack : R_max = 1.435TFlops, R_peak = 1.618TFlops, R_max / R_peak = 88.69%
コメント
この記事をはてなブックマークに追加