最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

GPU の数と SDPARA の性能

2013年05月21日 00時28分04秒 | Weblog
やはり 1ノードで 4GPUは、PCI-Express のバンド幅の制限であまり性能が出ない(4 ノード x 4GPU)。1ノードで 3GPU が一番性能が高いことが多い(以下の例など)。

◯問題:tai26a.dat-s
◯ソフトウェア SDPARA 7.6.0-G

1: 8GPU (4 x 2)
[gpdpotrf] ### END n=211926, nb=1024 took 1353.257246sec --> 2344.504699GFlops ###
2: 12GPU (4 x 3)
[gpdpotrf] ### END n=211926, nb=1024 took 880.964587sec --> 3601.413744GFlops ###
3: 16GPU (4 x 4)
[gpdpotrf] ### END n=211926, nb=1024 took 1174.209727sec --> 2702.002801GFlops ###

◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64

コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする