前回のドロップインライブラリの続き。GeForce GTC TITAN ならば使用した方が速いが、Tesla C1060 では使用しない方が速い。
○ mcp2000-10.dat-s
実行マシン1:19.31s (CPU)
実行マシン1:10.96s (CPU + GPU)
実行マシン2:29.96s (CPU)
実行マシン2:43.79s (CPU + GPU)
○ mcp5000-10.dat-s
実行マシン1:258.35s (CPU)
実行マシン1:101.43s (CPU + GPU)
実行マシン2:401.63s (CPU)
実行マシン2:699.53s (CPU + GPU)
○実行マシン1のスペック
Intel(R) Core(TM) i7-3930K CPU @ 3.20GHz + GeForce GTX TITAN x 2 + メモリ 12GB + CentOS 6 + CUDA 6 + Intel Compiler 14.0.3
○実行マシン2のスペック
Intel(R) Core(TM) i7-2600K CPU @ 3.40GHz + GeForce Tesla C1060 + メモリ 8GB + CentOS 6 + CUDA 6 * Intel Compiler 14.0.3
○ mcp2000-10.dat-s
実行マシン1:19.31s (CPU)
実行マシン1:10.96s (CPU + GPU)
実行マシン2:29.96s (CPU)
実行マシン2:43.79s (CPU + GPU)
○ mcp5000-10.dat-s
実行マシン1:258.35s (CPU)
実行マシン1:101.43s (CPU + GPU)
実行マシン2:401.63s (CPU)
実行マシン2:699.53s (CPU + GPU)
○実行マシン1のスペック
Intel(R) Core(TM) i7-3930K CPU @ 3.20GHz + GeForce GTX TITAN x 2 + メモリ 12GB + CentOS 6 + CUDA 6 + Intel Compiler 14.0.3
○実行マシン2のスペック
Intel(R) Core(TM) i7-2600K CPU @ 3.40GHz + GeForce Tesla C1060 + メモリ 8GB + CentOS 6 + CUDA 6 * Intel Compiler 14.0.3