最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

HP Moonshot 納品その3

2015年04月05日 01時00分06秒 | Weblog
HP ProLiant m710 サーバーカートリッジ

プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 8GB(1x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ 使用可能DIMMスロット数 SODIMMスロット x 4 最大構成 32GB(4 x 8GB)
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 120GB & 480GB

この Moonshot で様々な設定を行いまして、SDPARA 7.4.0 の実行を行ってみました。45ノード x 4 スレッド = 180 スレッドでの実行です。
10GbE が搭載されていることありまして、そこそこ速いと思います。

[fujisawa@cal01 sdpara]$ time mpiexec -n 45 -machinefile ~/mpd.hosts ./sdpara ~/sdpa-source.gcc/data/Be.1S.SV.pqgt1t2p.dat-s out.Be.new
SDPA start at [Sun Apr 5 00:54:25 2015]
param is ./param.sdpa
data is /home/fujisawa/sdpa-source.gcc/data/Be.1S.SV.pqgt1t2p.dat-s : sparse
out is out.Be.new
NumNodes is set as 45
NumThreads is set as 4
Schur computation : DENSE
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 -0.00e+00 -9.87e+04 8.6e-01 1.0e+00 2.00e-01
1 1.9e+03 1.4e-01 4.2e-15 +1.78e+00 -1.51e+05 7.7e-01 7.7e-01 2.00e-01
2 6.1e+02 3.2e-02 4.4e-15 -8.41e+00 -1.92e+05 5.3e-01 5.3e-01 2.00e-01
3 3.5e+02 1.5e-02 4.4e-15 -8.33e+00 -2.15e+05 4.3e-01 4.3e-01 2.00e-01
4 2.3e+02 8.5e-03 4.8e-15 -7.00e+00 -2.17e+05 8.1e-01 1.9e+00 2.00e-01
5 7.4e+01 1.6e-03 1.3e-14 -6.16e+00 -1.71e+05 8.3e-01 1.4e+00 2.00e-01
6 1.4e+01 2.8e-04 3.7e-14 -5.93e+00 -4.79e+04 8.1e-01 1.1e+00 2.00e-01
7 2.5e+00 5.3e-05 5.8e-15 -5.90e+00 -9.36e+03 8.6e-01 1.0e+00 2.00e-01
8 4.7e-01 7.6e-06 1.4e-14 -5.91e+00 -1.87e+03 8.5e-01 1.1e+00 2.00e-01
9 6.3e-02 1.1e-06 6.4e-13 -5.98e+00 -2.48e+02 8.7e-01 9.9e-01 2.00e-01
10 1.4e-02 1.5e-07 1.7e-11 -6.59e+00 -6.10e+01 7.9e-01 7.1e-01 2.00e-01
11 5.6e-03 3.0e-08 1.7e-09 -1.02e+01 -3.36e+01 8.7e-01 5.0e-01 2.00e-01
12 2.9e-03 3.9e-09 1.4e-08 -1.33e+01 -2.61e+01 7.5e-01 5.8e-01 2.00e-01
13 1.5e-03 9.7e-10 1.9e-08 -1.36e+01 -2.03e+01 8.7e-01 8.6e-01 2.00e-01
14 4.6e-04 1.2e-10 1.1e-07 -1.40e+01 -1.60e+01 7.5e-01 7.3e-01 2.00e-01
15 1.9e-04 1.2e-10 2.6e-06 -1.42e+01 -1.50e+01 4.3e-01 6.7e-01 2.00e-01
16 1.0e-04 1.2e-10 6.2e-06 -1.43e+01 -1.48e+01 2.0e-01 3.0e-01 2.00e-01
17 8.5e-05 1.2e-10 4.7e-06 -1.44e+01 -1.47e+01 7.3e-01 4.2e-01 2.00e-01
18 4.2e-05 1.2e-10 6.0e-06 -1.45e+01 -1.47e+01 6.5e-01 2.8e-01 2.00e-01
19 2.7e-05 1.2e-10 4.6e-06 -1.46e+01 -1.47e+01 9.2e-01 5.5e-01 2.00e-01
20 1.2e-05 1.2e-10 1.8e-06 -1.46e+01 -1.47e+01 8.8e-01 6.1e-01 2.00e-01
21 5.7e-06 1.2e-10 7.0e-07 -1.46e+01 -1.46e+01 7.5e-01 5.5e-01 2.00e-01
22 3.0e-06 1.2e-10 3.1e-07 -1.46e+01 -1.46e+01 7.7e-01 5.3e-01 2.00e-01
23 1.6e-06 1.2e-10 1.4e-07 -1.46e+01 -1.46e+01 7.4e-01 4.7e-01 2.00e-01
24 9.3e-07 1.2e-10 7.7e-08 -1.46e+01 -1.46e+01 8.0e-01 4.2e-01 2.00e-01
25 5.7e-07 1.2e-10 4.5e-08 -1.46e+01 -1.46e+01 9.3e-01 4.6e-01 2.00e-01
26 3.3e-07 1.2e-10 2.4e-08 -1.46e+01 -1.46e+01 7.4e-01 6.3e-01 2.00e-01
27 1.6e-07 1.2e-10 8.8e-09 -1.46e+01 -1.46e+01 1.0e+00 5.5e-01 2.00e-01
28 8.0e-08 1.2e-10 4.0e-09 -1.46e+01 -1.46e+01 7.4e-01 6.6e-01 2.00e-01
29 3.8e-08 1.2e-10 1.4e-09 -1.46e+01 -1.46e+01 6.8e-01 6.1e-01 2.00e-01
30 1.9e-08 1.2e-10 5.4e-10 -1.46e+01 -1.46e+01 6.1e-01 4.5e-01 2.00e-01
31 1.2e-08 1.2e-10 3.0e-10 -1.46e+01 -1.46e+01 4.3e-01 4.3e-01 2.00e-01
32 7.7e-09 1.2e-10 1.7e-10 -1.46e+01 -1.46e+01 4.5e-01 5.7e-01 2.00e-01
33 4.3e-09 1.2e-10 7.3e-11 -1.46e+01 -1.46e+01 7.1e-01 3.2e-01 2.00e-01
34 3.0e-09 1.2e-10 5.0e-11 -1.46e+01 -1.46e+01 7.2e-01 4.6e-01 1.00e-01
35 1.7e-09 1.2e-10 2.7e-11 -1.46e+01 -1.46e+01 6.1e-01 4.3e-01 1.00e-01
36 1.0e-09 1.2e-10 1.5e-11 -1.46e+01 -1.46e+01 8.9e-01 5.9e-01 1.00e-01
37 4.6e-10 1.2e-10 6.3e-12 -1.46e+01 -1.46e+01 8.9e-01 5.9e-01 1.00e-01

phase.value = pdOPT
Iteration = 37
mu = +4.6485556408348650e-10
relative gap = +9.0857141157603000e-08
gap = +1.3279289774459357e-06
digits = +7.0416409324895941e+00
objValPrimal = -1.4615570115909357e+01
objValDual = -1.4615571443838334e+01
p.feas.error = +1.3809157084089823e-08
d.feas.error = +1.1961575313579331e-08
total time = 254.358519
main loop time = 253.659472
total time = 254.358519
file check time = 0.000000
file change time = 0.000782
file read time = 0.698265
SDPA end at [Sun Apr 5 00:59:14 2015]
ALL TIME = 288.809338

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする