最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPARA 7.6.0 と 7.7.0 の性能比較

2015年03月24日 13時46分12秒 | Weblog
SDPARA 7.6.0 と 7.7.0 の性能比較を以下の右下の GPU クラスタで行った。7.7.0 では使用するメモリ量も約半分になっている。



SDPARA 7.6.0
[gpdpotrf] ### END n=47142, nb=2048, 2x4 procs, ver 50: 38.232sec --> 913.429GFlops ###
[gpdpotrf] ### END n=107206, nb=2048, 2x4 procs, ver 50: 259.015sec --> 1585.664GFlops ###
[gpdpotrf] ### END n=152928, nb=2048, 2x4 procs, ver 50: 648.597sec --> 1838.083GFlops ###
[gpdpotrf] ### END n=180625, nb=2048, 2x4 procs, ver 50: 1018.218sec --> 1929.174GFlops ###
[gpdpotrf] ### END n=211926, nb=2048, 2x4 procs, ver 50: 1592.583sec --> 1992.184GFlops ###

SDPARA 7.7.0
[gt_potrf] ### END n=47142, nb=2048, 2x4 procs, ver 100: 28.098sec --> 1242.891GFlops ###
[gt_potrf] ### END n=107206, nb=2048, 2x4 procs, ver 100: 202.678sec --> 2026.423GFlops ###
[gt_potrf] ### END n=152928, nb=2048, 2x4 procs, ver 100: 527.194sec --> 2261.360GFlops ###
[gt_potrf] ### END n=180625, nb=2048, 2x4 procs, ver 100: 852.761sec --> 2303.483GFlops ###
[gt_potrf] ### END n=211926, nb=2048, 2x4 procs, ver 100: 1349.551sec --> 2350.943GFlops ###
[gt_potrf] ### END n=247131, nb=2048, 2x4 procs, ver 100: 2121.284sec --> 2371.710GFlops ###

◯計算サーバ:GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(2台)
CPU:Xeon X5690(3.46GHz,6core)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 九州大学ウエスト1号館プロ... | トップ | HP Moonshot 納品 »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事