ブロックサイズ nb は 1024 が以前は最適な値だったが、現在では以下のように nb = 2048 の方が性能が高くなっている。まだまだわからないことが多い。
[gpdpotrf] ### END n=286552, nb=1024, 4x4 procs, ver 40: 2691.044986sec --> 2914.527244GFlops ###
[gpdpotrf] ### END n=286552, nb=2048, 4x4 procs, ver 40: 1996.727975sec --> 3927.988201GFlops ###
◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
[gpdpotrf] ### END n=286552, nb=1024, 4x4 procs, ver 40: 2691.044986sec --> 2914.527244GFlops ###
[gpdpotrf] ### END n=286552, nb=2048, 4x4 procs, ver 40: 1996.727975sec --> 3927.988201GFlops ###
◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64