最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Graph500 の最新結果

2012年12月09日 01時56分32秒 | Weblog
Graph500 用プログラムの最新結果。以下の80コアマシン(HT)で最速の10GTEPS越え。というわけなので、SandyBridge の 4-way マシンにも期待。

----------------------------------------------------------------------
Parallel Breadth-First Search for Graph500 Benchmark version 3.58
----------------------------------------------------------------------
CPU name is Intel(R) Xeon(R) CPU E7- 4870 @ 2.40GHz
freq / RAM is 2400.101 MHz / 504.78 GB
#cpu, #nodes, #cores is 80 4 20
COMPILER is GCC (GNU C Compiler) version 4.4.6
----------------------------------------------------------------------
scale, edgefactor is 25 16
energy_loop is disable
#threads, #NUMAs is 80 4
mpol_bind is ON(mmap with mbind(MPOL_BIND))
mem_interleave is OFF
switching parameter is 20 4
queue buffer size is 16384
----------------------------------------------------------------------
SCALE: 25
nvtx: 33554432
edgefactor: 16
terasize: 8.58993459199999983e-03
A: 5.69999999999999951e-01
B: 1.90000000000000002e-01
C: 1.90000000000000002e-01
D: 5.00000000000000444e-02
generation_time: 1.24387509822845459e+01
construction_time: 1.37996511459350586e+01
nbfs: 64
min_time: 4.20968532562255859e-02
firstquartile_time: 4.82609272003173828e-02
median_time: 5.12219667434692383e-02
thirdquartile_time: 5.69275021553039551e-02
max_time: 6.75561428070068359e-02
mean_time: 5.19287958741188049e-02
stddev_time: 5.63412806482527055e-03
min_nedge: 5.36865498000000000e+08
firstquartile_nedge: 5.36865498000000000e+08
median_nedge: 5.36865498000000000e+08
thirdquartile_nedge: 5.36865498000000000e+08
max_nedge: 5.36865498000000000e+08
mean_nedge: 5.36865498000000000e+08
stddev_nedge: 0.00000000000000000e+00
min_TEPS: 7.94695309253678989e+09
firstquartile_TEPS: 9.70066545801282120e+09
median_TEPS: 1.06109048921927681e+10
thirdquartile_TEPS: 1.12622232967597618e+10
max_TEPS: 1.27531028205915718e+10
harmonic_mean_TEPS: 1.03384931031603718e+10
harmonic_stddev_TEPS: 1.41320586034279168e+08

◯計算サーバ:Intel Xeon Westmere-EX 40 コアマシン
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
VGA GLADIAC GTX 580 1.5GB
Supermicro 4 way 4U Tower Server
1400W redundant 電源
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする