最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

新クラスタ計算機での Graph500

2010年12月23日 05時07分59秒 | Weblog
Graph 500 のリファレンス実装の MPI 版を新クラスタ計算機を実行してみた。SCALE 値が大きくなると非常に実行時間が長くなるので、SCALE=18 (点数 2^18 = 262144)の結果を掲載する。実行時間は 14m36.435s となる。

SCALE: 18
edgefactor: 16
NBFS: 64
graph_generation: 5.3845 s
num_mpi_processes: 16
construction_time: 825.429 s
min_time: 0.200316 s
firstquartile_time: 0.20415 s
median_time: 0.206919 s
thirdquartile_time: 0.211234 s
max_time: 0.22163 s
mean_time: 0.207864 s
stddev_time: 0.00513509
min_nedge: 67108080
firstquartile_nedge: 67108080
median_nedge: 67108080
thirdquartile_nedge: 67108080
max_nedge: 67108080
mean_nedge: 67108080
stddev_nedge: 0
min_TEPS: 3.02793e+08 TEPS
firstquartile_TEPS: 3.17695e+08 TEPS
median_TEPS: 3.24321e+08 TEPS
thirdquartile_TEPS: 3.2872e+08 TEPS
max_TEPS: 3.35011e+08 TEPS
harmonic_mean_TEPS: 3.22846e+08 TEPS
harmonic_stddev_TEPS: 1.00484e+06
min_validate: 0.452902 s
firstquartile_validate: 0.454387 s
median_validate: 0.45865 s
thirdquartile_validate: 0.470509 s
max_validate: 0.531631 s
mean_validate: 0.473651 s
stddev_validate: 0.0295647

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする