最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

九大スパコンでの Graph500

2016年06月08日 00時48分42秒 | Weblog
HA8000 では 1プロセスから 2プロセスのときの性能差が異様に大きくなっておりますが、これであっているのでしょうか?

()の中は1ノード内での MPI プロセス数。
SCALE=28
CX400
4nodes 5.9GTEPS (1), 12.4GTEPS (2)
8nodes 11.7GTEPS (1), 24.7GTEPS (2)
16nodes 22.5GTEPS (1), 46.3GTEPS (2)
32nodes 41.3GTEPS (1), 87.7GTEPS (2)
HA8000
4nodes 6.9GTEPS (1), 13.7GTEPS (2), 21.8GTEPS (4)
8nodes 12.3GTEPS (1), 38.6GTEPS (2), 40.5GTEPS (4)
16nodes 24.6GTEPS (1), 67.9GTEPS (2), 74.0GTEPS (4)
32nodes 26.3GTEPS (1), 114.2GTEPS (2), 127.9GTEPS (4)

SCALE=34 
HA8000
32nodes 58.9GTEPS (1), 131.8GTEPS(2), 130.8GTEPS(4)

高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)


高性能アプリケーションサーバ HA8000-tc/HT210
◯CPUノード
Intel Xeon E5-2697 v2 (2.7 GHz, 12core)×2
主記憶容量 256GB
◯Xeon Phiノード
Intel Xeon E5-2697 v2 (2.7 GHz, 12core)×2 Intel Xeon Phi 5100P (1,010.88 GFLOPS)×2
主記憶容量 256GB
総ノード数 965ノード
(CPU : 860ノード, Xeon Phi : 105ノード)
総CPUコア数 23,160コア
理論演算性能(倍精度実数)の総和 712.46TFLOPS
(CPU : 500.26TFLOPS, Xeon Phi : 212.2TFLOPS)
主記憶容量の総和 約241.25TB
ディスクアレイ装置 実効容量 3.57PB
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする