前回の続きで Graph500 のプログラムを最新版に変更してみた。HT(24コア)まで含めると両者の差はまた広がった。
◯Graph500:
median_TEPS: 3.35214696043723011e+09 : TSUBAME 2.0 : 12コア
median_TEPS: 3.09271218051088619e+09 : TSUBAME 2.0 : 24コア
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 25238.3844 0.0013 0.0013 0.0018
Scale: 23877.9093 0.0014 0.0013 0.
Add: 23976.0143 0.0020 0.0020 0.0020
Triad: 24781.7075 0.0022 0.0019 0.0045
-------------------------------------------------------------
◯Graph500
median_TEPS: 3.89977029220511246e+09 : OPT クラスタ(変更後): 12コア
median_TEPS: 4.15981347531130791e+09 : OPT クラスタ(変更後): 24コア
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 29407.9159 0.0011 0.0011 0.0011
Scale: 28520.5542 0.0011 0.0011 0.0011
Add: 28814.4543 0.0017 0.0017 0.0017
Triad: 29720.4889 0.0016 0.0016 0.0016
-------------------------------------------------------------
◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel X5670 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps
◯ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.9 for x86_64