SDPARA-G の Cholesky 分解性能について。以下の環境(4ノード, 16GPU)で 228655 x 286552 の行列の Cholesky 分解 2746.57 秒(約 2855.57 GFlops)。
[gpdpotrf] ### END n=286552, nb=1024 took 2746.579950sec --> 2855.596440GFlops ###
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
[gpdpotrf] ### END n=286552, nb=1024 took 2746.579950sec --> 2855.596440GFlops ###
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64