最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

京大 T2K スパコンと SDPARA その4

2010年06月11日 22時34分43秒 | Weblog
実行期間が2週間と短かったので、京大 T2K スパコンで実行したときには、スレッド数と性能向上の関係などの測定ができなかった。そこで、ほぼ同等の CPU を持つ計算サーバを用いて、スレッド数を変化させながら実行時間の測定を行ってみた。この場合、BLAS はシングルスレッドで動作させているので、スレッド数による性能向上は基本的に SCM(Schur complement matrix)を作成する際のマルチスレッド化の効果による。この CPU (Barcelona) でも、マルチスレッド化の効果は非常に大きいのだが、京大 T2K スパコンのように 4CPU X 4 スレッド、つまり全部で 16 スレッド使った場合でも性能向上が起きるかというと、Barcelona とチップセットの性能を考えると、それは怪しいところがある。

○問題 LiH.1Sigma+.STO6G.pqgt1t2p.dat-s
2CPU x 1 スレッド : 123.23s
2CPU x 2 スレッド : 64.27s
2CPU x 4 スレッド : 35.00s

○問題 FH2+.1A1.STO6G.pqgt1t2p.dat-s
2CPU x 1 スレッド : 720.37s
2CPU x 2 スレッド : 356.80s
2CPU x 4 スレッド : 186.29s

---------------------------------------------------------------------

○ソフトウェア SDPARA 7.3.2
○計算サーバ
CPU : AMD Opteron 2356 2.3GHz (quad cores)x 2
Memory : 32GB
OS : Vine Linux 5.1 for x86_64

○ 京大 T2K スパコン : SDPARA 7.3.2
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする