最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA クラスタで Linpack 測定 その6

2008年10月07日 02時20分32秒 | Weblog
SDPA クラスタでの Linpack 測定だが、後藤さんのおかげで 1.415 TFlops に達した。性能比率は 1.415 / 1.61792 = 87.45% となった。いつものようにマルチスレッドで動作させるときのコアの割り当てだけではなく、MPI の Rank によって割り当てる CPU を指定する必要がある。
今後は OpenMPI の採用、HugeTLBfs の使用、不必要なプロセスの停止などを予定している。これらは SDPARA の実行にも影響を与えるかもしれない。

●新 SDPA クラスタ (2008年)
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
HDD : 6TB(RAID 5) / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.2 for x86_64
Linpack : R_max = 1.415TFlops, R_peak = 1.618TFlops, R_max / R_peak = 87.45%

============================================================================
T/V N NB P Q Time Gflops
----------------------------------------------------------------------------
WR10R2R4 300000 200 4 8 12719.44 1.415e+03
----------------------------------------------------------------------------
||Ax-b||_oo / ( eps * ||A||_1 * N ) = 0.0011071 ...... PASSED
||Ax-b||_oo / ( eps * ||A||_1 * ||x||_1 ) = 0.0017166 ...... PASSED
||Ax-b||_oo / ( eps * ||A||_oo * ||x||_oo ) = 0.0002822 ...... PASSED
===========================================================================
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする