SDPARA-G の Cholesky 分解性能について。12GPU --> 16GPU の性能伸びが小さい。。。
◯4ノード x 4 GPU
[gpdpotrf] ### END n=247131, nb=1024 took 1788.106281sec --> 2813.630714GFlops ###
◯4ノード x 3 GPU
[gpdpotrf] ### END n=247131, nb=1024 took 1906.642593sec --> 2638.706788GFlops ###
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
◯4ノード x 4 GPU
[gpdpotrf] ### END n=247131, nb=1024 took 1788.106281sec --> 2813.630714GFlops ###
◯4ノード x 3 GPU
[gpdpotrf] ### END n=247131, nb=1024 took 1906.642593sec --> 2638.706788GFlops ###
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64