OpenBLAS 0.2.10 と Intel MKL 11.1-3 の性能差について SDPA を用いて比較してみました。
◯ ソフトウェア SDPA 7.4.0
◯問題1:karate.dat-s
gcc 4.4.7 + Intel MKL 11.1-3 : 167.52s
gcc 4.4.7 + OpenBLAS 0.2.10 : 160.04s
◯問題2:nug12_r2.dat-s
gcc 4.4.7 + Intel MKL 11.1-3 : 44.23s
gcc 4.4.7 + OpenBLAS 0.2.10 : 51.78s
◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.4.7 + Intel MKL 11.1-3 : 97.27s
gcc 4.4.7 + OpenBLAS 0.2.10 : 104.44s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4650 (8-core 2.70GHz 16MB cache) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.5
◯ ソフトウェア SDPA 7.4.0
◯問題1:karate.dat-s
gcc 4.4.7 + Intel MKL 11.1-3 : 167.52s
gcc 4.4.7 + OpenBLAS 0.2.10 : 160.04s
◯問題2:nug12_r2.dat-s
gcc 4.4.7 + Intel MKL 11.1-3 : 44.23s
gcc 4.4.7 + OpenBLAS 0.2.10 : 51.78s
◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.4.7 + Intel MKL 11.1-3 : 97.27s
gcc 4.4.7 + OpenBLAS 0.2.10 : 104.44s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4650 (8-core 2.70GHz 16MB cache) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.5