最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPARA の SDPA クラスタ上での実行 その2

2008年10月05日 15時35分31秒 | Weblog
本の原稿のために実験結果を最新のものに変更した。昨日の図を見てもらえればわかるのだが、MPI で 128 プロセス(16ノード×8コア)使うということは、1ノードで 8 プロセス使うということなので、二つのコアが一つの L2 キャッシュを共有することになって、性能が落ちることになる。実際に添付の表の結果を見ると 64 台(プロセス)と 128 台(プロセス)では、64 台の方が速くなっている。これが Linpack 測定だと 64 台よりも 128 台の方が速いので、SDPARA の方がキャッシュやメモリ使用などで改善の余地があることがわかる。今考えている方法は、
1:問題自体を前処理して、現在のプログラムでも性能が出るようにする。
2:プログラムの疎性を扱う部分のアルゴリズムを変更する。
ということなので、両方行うことになる可能性が高い。昔は1ノードで 1CPU か 2CPU(しかもシングルコア)だったので、台数効果がわかりやすい形で出てきたが、現在はマルチコアの CPU なので、その辺の効果はやや複雑になっている。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする