最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

SDPARA 7.6.1 その3

2017年08月11日 00時48分08秒 | Weblog
CUDA 8.0 から 9.0RC に変更したところ、また少しだけ性能が上がりました。。。

◯SDPARA 7.6.1 の性能値
Intel Compiler 17.0.4 + OpenMPI 2.1.1

◯2017年8月5日
CUDA 8.0
[gpdpotrf] ### END n=152928, nb=2048, 1x2 procs, ver 50: 237.416sec --> 5021.465GFlops ###

◯2017年8月6日
CUDA 9.0RC
[gpdpotrf] ### END n=152928, nb=2048, 1x2 procs, ver 50: 235.218sec --> 5068.383GFlops ###

◯計算サーバ
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2個
メモリ:512GB
GPU : NVIDIA Tesla P100
OS : CentOS 7.3


◯SDPARA 7.6.1 の性能値
Intel Compiler 17.0.4 + OpenMPI 2.1.1
[gpdpotrf] ### END n=152928, nb=2048, 1x2 procs, ver 50: 242.827sec --> 4909.569GFlops ###

K. Fujisawa, T. Endo, Y. Yasui, H. Sato, N. Matsuzawa, S. Matsuoka and H. Waki, Peta-scale General Solver for Semidefinite Programming Problems with over Two Million Constraints, The 28th IEEE International Parallel & Distributed Process- ing Symposium (IPDPS 2014), pp 1171-1180, 2014(Acceptance rate 21.1%). DOI: 10.1109/IPDPS.2014.121
ジャンル:
ウェブログ
コメント   この記事についてブログを書く
この記事をはてなブックマークに追加
« Caffe, Boost, CUDA, cuDNN | トップ | IT Japan Award 2017特別賞 »
最近の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事

トラックバック

この記事のトラックバック  Ping-URL
ブログ作成者から承認されるまでトラックバックは反映されません。