AmazonEC2 を借りて SDPA 7.3.2 + 各 BLAS で数値実験を行った。その2の方は仮想マシンではなく実機上での実験なので結果を比較していただきたい。
○AmazonEC2 extra large タイプ
CPU : E5430 @ 2.66GHz 4 コア
Memory : 16GB
gcc : 4.1.2
Intel コンパイラ 11.1
OS : Fedora 8 for x86_64
仮想マシン : Xen
OMP_NUM_THREADS=4
○BLAS ライブラリ
BLAS : 3.2.1
ACML : 4.4.0
MKL : 11.1.072
GotoBLAS2 : 1.13
----------------------------------------------------------------
○ theta6.dat-s
BLAS : 13m11.976s
ACML : 52.608s
MKL : 57.941s
GotoBLAS2 : 1m0.018s
○ mcp500-1.dat-s
BLAS : 8.058s
ACML : 7.544s
MKL : 7.954s
GotoBLAS2 : 9.174s
○ LiH.1Sigma+.STO6G.pqgt1t2p.dat-s
BLAS : 1m8.771s
ACML : 1m39.709s
MKL : 1m31.970s
GotoBLAS2 : 1m23.251s
○ mater6.dat-s
BLAS : 1m31.411s
ACML : 17m31.359s
MKL : 1m57.124s
GotoBLAS2 : 17m18.225s
○AmazonEC2 extra large タイプ
CPU : E5430 @ 2.66GHz 4 コア
Memory : 16GB
gcc : 4.1.2
Intel コンパイラ 11.1
OS : Fedora 8 for x86_64
仮想マシン : Xen
OMP_NUM_THREADS=4
○BLAS ライブラリ
BLAS : 3.2.1
ACML : 4.4.0
MKL : 11.1.072
GotoBLAS2 : 1.13
----------------------------------------------------------------
○ theta6.dat-s
BLAS : 13m11.976s
ACML : 52.608s
MKL : 57.941s
GotoBLAS2 : 1m0.018s
○ mcp500-1.dat-s
BLAS : 8.058s
ACML : 7.544s
MKL : 7.954s
GotoBLAS2 : 9.174s
○ LiH.1Sigma+.STO6G.pqgt1t2p.dat-s
BLAS : 1m8.771s
ACML : 1m39.709s
MKL : 1m31.970s
GotoBLAS2 : 1m23.251s
○ mater6.dat-s
BLAS : 1m31.411s
ACML : 17m31.359s
MKL : 1m57.124s
GotoBLAS2 : 17m18.225s