引き続いて以下の大きな SDP をたくさん解いていますが、Cholesky 分解部分では 16GPU(NVIDIA Tesla C2075) で 2511GFlops という性能になっています。
140185 = mDIM
2 = nBLOCK
-559682 530 = bLOCKsTRUCT
[gpdpotrf] ### END n=140185, nb=1024 took 365.607065sec --> 2511.706004GFlops ###
◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
140185 = mDIM
2 = nBLOCK
-559682 530 = bLOCKsTRUCT
[gpdpotrf] ### END n=140185, nb=1024 took 365.607065sec --> 2511.706004GFlops ###
◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64