OpenBLAS と比較してみたのですが、かなり性能差があるように見えます。。。
ソフトウェア SDPA 7.4.1
◯問題1:karate.dat-s
gcc 4.8.5 + OpenBLAS 0.3.1.dev : 161.41s
icc 18.0.3 + Intel MKL 2018.3 : 103.85s
icc 18.0.3(xHost) + Intel MKL 2018.3 : 103.97s
◯問題2:DSJC500.9.dat-s
gcc 4.8.5 + OpenBLAS 0.3.1.dev : 50.52s
icc 18.0.3 + Intel MKL 2018.3 : 31.35s
icc 18.0.3(xHost) + Intel MKL 2018.3 : 31.36s
◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.8.5 + OpenBLAS 0.3.1.dev : 159.30s
icc 18.0.3 + Intel MKL 2018.3 : 157.21s
icc 18.0.3(xHost) + Intel MKL 2018.3 : 157.20s
◯計算サーバ
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2個
メモリ:512GB
GPU : NVIDIA Tesla P100 x 2
OS : CentOS 7.5
ソフトウェア SDPA 7.4.1
◯問題1:karate.dat-s
gcc 4.8.5 + OpenBLAS 0.3.1.dev : 161.41s
icc 18.0.3 + Intel MKL 2018.3 : 103.85s
icc 18.0.3(xHost) + Intel MKL 2018.3 : 103.97s
◯問題2:DSJC500.9.dat-s
gcc 4.8.5 + OpenBLAS 0.3.1.dev : 50.52s
icc 18.0.3 + Intel MKL 2018.3 : 31.35s
icc 18.0.3(xHost) + Intel MKL 2018.3 : 31.36s
◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.8.5 + OpenBLAS 0.3.1.dev : 159.30s
icc 18.0.3 + Intel MKL 2018.3 : 157.21s
icc 18.0.3(xHost) + Intel MKL 2018.3 : 157.20s
◯計算サーバ
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2個
メモリ:512GB
GPU : NVIDIA Tesla P100 x 2
OS : CentOS 7.5