gcc, OpenBLAS, Intel コンパイラ, Intel MKL の組み合わせについて比較実験を行ってみた。
◯ ソフトウェア SDPA 7.4.0 + OpenBLAS 0.2.5
◯問題1:karate.dat-s
gcc 4.4.7 + MKL 11.0.5 : 135.09s
gcc 4.4.7 + OpenBLAS 2.5 : 164.72s
icc 13.1.3 + MKL 11.0.5 : 134.00s
icc 13.1.3 + OpenBLAS 2.5 : 157.08s
◯問題2:nug12_r2.dat-s
gcc 4.4.7 + MKL 11.0.5 : 52.87s
gcc 4.4.7 + OpenBLAS 2.5 : 53.56s
icc 13.1.3 + MKL 11.0.5 : 46.04s
icc 13.1.3 + OpenBLAS 2.5 : 54.04s
◯問題3:FH2+.1A1.STO6G.pqgt1t2p.dat-s
gcc 4.4.7 + MKL 11.0.5 : 21.67s
gcc 4.4.7 + OpenBLAS 2.5 : 30.80s
icc 13.1.3 + MKL 11.0.5 : 22.13s
icc 13.1.3 + OpenBLAS 2.5 : 30.16s
◯問題4:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.4.7 + MKL 11.0.5 : 99.68s
gcc 4.4.7 + OpenBLAS 2.5 : 113.91s
icc 13.1.3 + MKL 11.0.5 : 98.65s
icc 13.1.3 + OpenBLAS 2.5 : 115.41s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.4
◯ ソフトウェア SDPA 7.4.0 + OpenBLAS 0.2.5
◯問題1:karate.dat-s
gcc 4.4.7 + MKL 11.0.5 : 135.09s
gcc 4.4.7 + OpenBLAS 2.5 : 164.72s
icc 13.1.3 + MKL 11.0.5 : 134.00s
icc 13.1.3 + OpenBLAS 2.5 : 157.08s
◯問題2:nug12_r2.dat-s
gcc 4.4.7 + MKL 11.0.5 : 52.87s
gcc 4.4.7 + OpenBLAS 2.5 : 53.56s
icc 13.1.3 + MKL 11.0.5 : 46.04s
icc 13.1.3 + OpenBLAS 2.5 : 54.04s
◯問題3:FH2+.1A1.STO6G.pqgt1t2p.dat-s
gcc 4.4.7 + MKL 11.0.5 : 21.67s
gcc 4.4.7 + OpenBLAS 2.5 : 30.80s
icc 13.1.3 + MKL 11.0.5 : 22.13s
icc 13.1.3 + OpenBLAS 2.5 : 30.16s
◯問題4:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.4.7 + MKL 11.0.5 : 99.68s
gcc 4.4.7 + OpenBLAS 2.5 : 113.91s
icc 13.1.3 + MKL 11.0.5 : 98.65s
icc 13.1.3 + OpenBLAS 2.5 : 115.41s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.4