前回の続きでサーバ1から4の4台のヘテロなクラスタ計算機を作ったので、以下のように SDPARA と SDPA で比較を行った。結果は以下のように予想通り。問題2や3のようなタイプの問題では、周辺で余っている普通の PC を GbE で接続してヘテロなクラスタ計算機を作って実行しても効果が期待できる。
1:問題1のように小さな問題ではヘテロなクラスタ計算機で実行するメリットは無し
2:問題2や問題3のように SCM(Schur Complement Matrix)に作成に時間がかかる場合には実行するメリットが出てくる
3:問題4のように SCM の Cholesky 分解に時間がかかる場合でもメリットは無い
○ヘテロなクラスタ計算機:サーバ1~4:SDPARA
○サーバ0: SDPA
○ 問題1:theta6.dat-s
○ SDPARA 47.96s
○ SDPA : 14.72s
○ 問題2: FH2+.1A1.STO6G.pqgt1t2p.dat-s
○ SDPARA : 88.94s
○ SDPA : 159.01s
○ 問題3:Be.1S.SV.pqgt1t2p.dat-s
○ SDPARA : 1840.38s
○ SDPA : 3877.12s
○ 問題4: nug12_r2.dat-s
○ SDPARA : 418.39s
○ SDPA : 210.28s
○サーバ0
CPU : Intel Corei7 965 3.20GHz
Memory : 12GB
OS : CentOS 5.6 for x86_64
○サーバ1
CPU : Intel Core 2 Quad 9650 3.0GHz
Memory : 8GB
OS : Fedora 15 for x86_64
○サーバ2
CPU : AMD Phenom(tm) II X4 955 3.2GHz
Memory : 8GB
OS : Fedora 15 for x86_64
○サーバ3
CPU : Intel Xeon E5530 2.4GHz
Memory : 6GB
OS : Fedora 15 for x86_64
○サーバ4
CPU : Intel Corei7 2600K 3.40GHz
Memory : 8GB
OS : Fedora 15 for x86_64
1:問題1のように小さな問題ではヘテロなクラスタ計算機で実行するメリットは無し
2:問題2や問題3のように SCM(Schur Complement Matrix)に作成に時間がかかる場合には実行するメリットが出てくる
3:問題4のように SCM の Cholesky 分解に時間がかかる場合でもメリットは無い
○ヘテロなクラスタ計算機:サーバ1~4:SDPARA
○サーバ0: SDPA
○ 問題1:theta6.dat-s
○ SDPARA 47.96s
○ SDPA : 14.72s
○ 問題2: FH2+.1A1.STO6G.pqgt1t2p.dat-s
○ SDPARA : 88.94s
○ SDPA : 159.01s
○ 問題3:Be.1S.SV.pqgt1t2p.dat-s
○ SDPARA : 1840.38s
○ SDPA : 3877.12s
○ 問題4: nug12_r2.dat-s
○ SDPARA : 418.39s
○ SDPA : 210.28s
○サーバ0
CPU : Intel Corei7 965 3.20GHz
Memory : 12GB
OS : CentOS 5.6 for x86_64
○サーバ1
CPU : Intel Core 2 Quad 9650 3.0GHz
Memory : 8GB
OS : Fedora 15 for x86_64
○サーバ2
CPU : AMD Phenom(tm) II X4 955 3.2GHz
Memory : 8GB
OS : Fedora 15 for x86_64
○サーバ3
CPU : Intel Xeon E5530 2.4GHz
Memory : 6GB
OS : Fedora 15 for x86_64
○サーバ4
CPU : Intel Corei7 2600K 3.40GHz
Memory : 8GB
OS : Fedora 15 for x86_64