最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA(SDPARA)のボトルネック

2011年08月20日 00時10分20秒 | Weblog
SDPA(SDPARA)の関数レベルでは以下の2つのように F3 式の計算か行列積(dgemm)がボトルネックとなっている。小さな問題や特殊な問題を別とするとおおよそ以下の2つのパターンに分類することができる。

○問題:Be.1S.SV.pqgt1t2p.dat-s
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls Ks/call Ks/call name
79.93 5925.08 5925.08 604172027 0.00 0.00 sdpa::Newton::calF3_thread_2(double&, sdpa::DenseMatrix&, sdpa::DenseMatrix&, sdpa::Sparse
Matrix&, sdpa::SparseMatrix&)
8.63 6564.87 639.79 dgemm_kernel
6.88 7074.83 509.96 38 0.01 0.17 sdpa::Newton::compute_bMat_dense_SDP3(sdpa::InputData&, sdpa::Solutions&, sdpa::WorkVariabl
es&, sdpa::ComputeTime&)
1.25 7167.63 92.80 dgemm_otcopy
0.43 7199.18 31.55 593271 0.00 0.00 dtrsm_oltncopy
0.39 7227.87 28.69 dgemm_beta

○問題:nug12_r2.dat-s
Each sample counts as 0.01 seconds.
% cumulative self self total
time seconds seconds calls s/call s/call name
59.57 1108.97 1108.97 dgemm_kernel
14.53 1379.39 270.42 dgemm_otcopy
13.88 1637.74 258.35 38 6.80 9.41 sdpa::Newton::compute_bMat_dense_SDP3(sdpa::InputData&, sdpa::Solutions&, sdpa::WorkVariabl
es&, sdpa::ComputeTime&)
5.33 1737.05 99.31 33818739 0.00 0.00 sdpa::Newton::calF3_thread_2(double&, sdpa::DenseMatrix&, sdpa::DenseMatrix&, sdpa::SparseM
atrix&, sdpa::SparseMatrix&)
2.74 1788.12 51.07 531633 0.00 0.00 dtrsm_oltncopy
2.38 1832.48 44.36 dtrsm_kernel_RN
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 超大規模グラフ解析プロジェ... | トップ | SDPA(SDPARA)のボトルネック ... »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事