最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

並列 Cholesky 分解のパラメータ その2

2011年03月12日 16時03分46秒 | Weblog
Two-dimensional block-cyclic 分割するときの行列のサイズのパラメータ調整を今度は 8 スレッドで行った。クラスタ計算機には 16 ノード x 12 コアで合計 192 コアが搭載されているが、16 ノード x 8 コア で合計 128 コアだけを用いて適切な行列のブロッキングサイズを計算により求めていく。8 スレッドの場合でも 12 スレッドと同様にブロッキングサイズ 128 が最速となった。



◯ブロッキングサイズ
64 : 621.62秒
80 : 690.68秒
88 : 651.95秒
92 : 649.06秒
112 : 638.43秒
120 : 595.71秒
128 : 471.00秒
136 : 597.74秒
144 : 582.23秒
160 : 511.34秒
192 : 495.42秒
224 : 521.09秒
256 : 499.47秒



○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント (1)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする