SDPA 7.0.2 と様々な BLAS との組み合わせの実験結果の一部は以下の通りである。
LAPACK, BLAS : Ver 3.0
ATLAS : Ver 3.7.33
GotoBLAS : Ver 1.15
Xeon 5160(3GHz) : Linux (Fedora Core 6 x86_64)
theta4.dat-s
SDPA + LAPACK + BLAS
real 45.007s user 44.953s sys 0.061s
SDPA + LAPACK + ATLAS
real 10.098s user 10.028s sys 0.068s
SDPA + LAPACK + GotoBLAS
real 5.562s user 10.107s sys 0.903s
m1000.dat-s (max cut problem : 1000 nodes)
SDPA + LAPACK + BLAS
real 2m40.041s user 2m39.874s sys 0.147s
SDPA + LAPACK + ATLAS
real 1m28.531s user 1m28.531s sys 0.128s
SDPA + LAPACK + GotoBLAS
real 0m29.240s user 1m22.850s sys 0.737s
多くの問題で実行時間は GotoBLAS <ATLAS < BLAS になっている。GotoBLAS はマルチスレッド対応が効いて実時間で比べると相当高速である。点数 1000 点のグラフに対する最大カット問題の SDP 緩和問題が 30 秒以内で解けるとは結構凄い。
LAPACK, BLAS : Ver 3.0
ATLAS : Ver 3.7.33
GotoBLAS : Ver 1.15
Xeon 5160(3GHz) : Linux (Fedora Core 6 x86_64)
theta4.dat-s
SDPA + LAPACK + BLAS
real 45.007s user 44.953s sys 0.061s
SDPA + LAPACK + ATLAS
real 10.098s user 10.028s sys 0.068s
SDPA + LAPACK + GotoBLAS
real 5.562s user 10.107s sys 0.903s
m1000.dat-s (max cut problem : 1000 nodes)
SDPA + LAPACK + BLAS
real 2m40.041s user 2m39.874s sys 0.147s
SDPA + LAPACK + ATLAS
real 1m28.531s user 1m28.531s sys 0.128s
SDPA + LAPACK + GotoBLAS
real 0m29.240s user 1m22.850s sys 0.737s
多くの問題で実行時間は GotoBLAS <ATLAS < BLAS になっている。GotoBLAS はマルチスレッド対応が効いて実時間で比べると相当高速である。点数 1000 点のグラフに対する最大カット問題の SDP 緩和問題が 30 秒以内で解けるとは結構凄い。