最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA 7.4.0 と超スレッド並列 その2

2014年05月03日 11時03分32秒 | Weblog
昨日続きですが 320 コア(SMP マシン)で実行時間 1125秒くらいでした。以下の 32 コアのマシンで 約 1445 秒ですので、性能的には 320 コアでも速くはないという感じがします。192 コアクラスタでは 877 秒です。


◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
39 1.6e-09 4.2e-10 2.0e-12 -5.44e+01 -5.44e+01 5.7e-01 4.6e-01 1.00e-01

phase.value = pdOPT
Iteration = 39
mu = +1.6374357999055438e-09
relative gap = +2.6102464253017309e-16
gap = -1.4210854715202004e-14
digits = +1.5583318490325775e+01
objValPrimal = -5.4442578974356053e+01
objValDual = -5.4442578974356039e+01
p.feas.error = +5.1257625991423740e-08
d.feas.error = +4.2363102747966508e-09
total time = 1445.316747


◯ OPT クラスタ(192コア)
39 1.6e-09 4.2e-10 1.5e-12 -5.44e+01 -5.44e+01 5.7e-01 4.6e-01 1.00e-01

phase.value = pdOPT
Iteration = 39
mu = +1.6384924033565957e-09
relative gap = +1.3051232127763777e-16
gap = -7.1054273576010019e-15
digits = +1.5884348485947990e+01
objValPrimal = -5.4442578969120362e+01
objValDual = -5.4442578969120355e+01
p.feas.error = +5.1272704259437692e-08
d.feas.error = +3.1356600163623405e-09
total time = 877.483618


仕様:
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4650 (8-core 2.70GHz 16MB cache) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.5

◯ OPT クラスタ(192コア)
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.9 for x86_64

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする