最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Intel Xeon 5670 とメモリバンド幅

2013年03月01日 02時50分03秒 | Weblog
以前のここで書いたように TSUBAME 2.0 とこちらの OPT クラスタは同じ CPU (Intel Xeon 5670) にも関わらず、Graph500 の結果に差があったのでメモリバンド幅を調べてみた。以下のようにメモリバンド幅にも結構な差があるようだ。

median_TEPS: 3.10677601976136351e+09 : TSUBAME 2.0
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 25238.3844 0.0013 0.0013 0.0018
Scale: 23877.9093 0.0014 0.0013 0.0014
Add: 23976.0143 0.0020 0.0020 0.0020
Triad: 24781.7075 0.0022 0.0019 0.0045
-------------------------------------------------------------

median_TEPS: 2.43110363832451296e+09 : OPT クラスタ
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 16268.8155 0.0020 0.0020 0.0020
Scale: 15361.9924 0.0021 0.0021 0.0021
Add: 14977.4284 0.0032 0.0032 0.0032
Triad: 15774.2374 0.0031 0.0030 0.0031
-------------------------------------------------------------

◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel X5670 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps

◯ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.9 for x86_64

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする