NVIDIA Tesla C1060 は倍精度演算性能が低いこともあって、以下のように Tesla C1060 1台と CPU 4コアでは後者の方が性能が良い。3年程前に購入したが、倍精度演算ではあまり使い道が無かった。
◯問題 nug12_r2.dat-s
◯SDPARA 7.5.0-G (CPU + GPU)
ELEMENTS : 48.87s
CHOLESKY : 204.37s
Total : 268.50s
◯SDPA 7.4.0 (CPU)
ELEMENTS : 12.73s
CHOLESKY : 96.31s
Total : 112.55s
○計算サーバ (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 2600K (3.40GHz / 8MB L3) x 2
Memory : 8GB (4 x 2GB)
GPGPU : Tesla C1060 x 1 (CUDA 4.2)
OS : CentOS 6.3
◯問題 nug12_r2.dat-s
◯SDPARA 7.5.0-G (CPU + GPU)
ELEMENTS : 48.87s
CHOLESKY : 204.37s
Total : 268.50s
◯SDPA 7.4.0 (CPU)
ELEMENTS : 12.73s
CHOLESKY : 96.31s
Total : 112.55s
○計算サーバ (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 2600K (3.40GHz / 8MB L3) x 2
Memory : 8GB (4 x 2GB)
GPGPU : Tesla C1060 x 1 (CUDA 4.2)
OS : CentOS 6.3