最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

大きな SDP (Sparse Cholesky 分解) その3

2013年02月03日 00時46分14秒 | Weblog
マルチスレッド計算(SCM が疎な場合)に関する改善後と改善前の結果について。

◯実行結果:改善後
1スレッド : 13155.50s
2スレッド : 9607.08s
4スレッド : 7716.14s
8スレッド : 6856.89s
16スレッド : 7054.77s
32スレッド : 8411.57s

◯実行結果:改善前
1スレッド : 14492.80s
2スレッド : 10331.28s
4スレッド : 8118.21s
8スレッド : 7402.06s
16スレッド : 7392.43s
32スレッド : 8437.92s

◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3

◯問題
* SDPA sparse format data
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
25724
37
-5460 -24289 363 323 323 323 323 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする