最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

SDPA 7.0.2 + GotoBLAS 1.1.5 その5

2007年07月20日 18時07分34秒 | Weblog
学会誌の解説記事のために SDPA 7.0.2 と GotoBLAS や ATLAS などの組み合わせや他のソフトウェアとの比較などを実験、調査した。BLAS には Level 1 (ベクトル単体あるいはベクトル同士の演算)、Level 2 (行列とベクトルの演算)、Level 3 (行列同士の演算)という三つのレベルに関数が分類されている。
gprof などでプロファイリングを取ってみると、表1のように SDPA では Level 3 の 行列積(dgemm)が全体の計算時間の中で占める割合が高いことがわかる。 またこの割合が高い程マルチスレッドで実行したときの高速化率が高いこともわかる(1コアと4コアでの比較より)。多項式最適化問題では探索方向を求めるための線形方程式の行列が疎になるので、疎行列に対する Cholesky 分解の占める割合が高くなる(やや特殊な例)。またノルム最小化問題では ddot(Level 1 の内積)が最も実行時間が長くなる(40パーセントで 1 位)。
コメント
この記事をはてなブックマークに追加