半正定値計画問題(SDP)において SCM(Schur Complement Matrix)のサイズが大きな場合では、高いメモリバンド幅を活かしてマルチスレッドで疎行列の計算が出来るということで AMD が有利、全体の実行時間の中で行列積の占める割合が増えると Intel が有利と思っていたのだが、後者でも意外と AMD が検討している。SDPA の中身を改造しているうちに特性が変わってきたのかもしれない。
以下は SDPA のマニュアルからの抜粋になる。nBLOCK と bLOCKsTRUCT というパラメータで問題の大きさを示している。mDIM は制約式の数で SCM のサイズと同じになる。
○問題1 mcp7000-10.dat-s : 最大カット問題
mDIM = 7000
nBLOCK = 1
bLOCKsTRUCT = 7000
サーバ1: 1419.845秒
サーバ2: 1580.958秒
サーバ3: 1347.291秒
この場合では行列積の計算に性能が依存するのだが、さすがに AMD でも 24 コアあると、Intel 8 コアには勝てるようだ。サーバ2と3を比較すると、AMD ではコア数が増えても行列積計算の伸びは低いことがわかる。
○問題2 HLi2.2A1.STO6G.pqgt1t2p.dat-s : 量子化学問題
mDIM = 10593
nBLOCK = 22
bLOCKsTRUCT = 11 11 11 11 55 55 121 55 55 121 242 121 121 165 605 605 165 1947 1947 605 605 -274
サーバ1: 20511.361秒
サーバ2: 30382.941秒
サーバ3: 18459.201秒
この場合では、総コア数が3倍あるサーバ3がサーバ1よりもわずかだけ性能が上回る。やはり Intel (質:1コアあたりの性能) v.s. AMD (量:コア数の多さ)の戦いになるようだ。
○サーバ1 (2 CPU x 4 コア = 8 コア)
CPU : Intel Xeon 5550 (2.66GHz / 8MB L3) x 2
Memory : 72GB (18 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○サーバ2 (2 CPU x 6 コア = 12 コア)
CPU : AMD Opteron 2435(2.6GHz / 6MB L3)x 2
Memory : 64GB(16 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○サーバ3 (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
以下は SDPA のマニュアルからの抜粋になる。nBLOCK と bLOCKsTRUCT というパラメータで問題の大きさを示している。mDIM は制約式の数で SCM のサイズと同じになる。
○問題1 mcp7000-10.dat-s : 最大カット問題
mDIM = 7000
nBLOCK = 1
bLOCKsTRUCT = 7000
サーバ1: 1419.845秒
サーバ2: 1580.958秒
サーバ3: 1347.291秒
この場合では行列積の計算に性能が依存するのだが、さすがに AMD でも 24 コアあると、Intel 8 コアには勝てるようだ。サーバ2と3を比較すると、AMD ではコア数が増えても行列積計算の伸びは低いことがわかる。
○問題2 HLi2.2A1.STO6G.pqgt1t2p.dat-s : 量子化学問題
mDIM = 10593
nBLOCK = 22
bLOCKsTRUCT = 11 11 11 11 55 55 121 55 55 121 242 121 121 165 605 605 165 1947 1947 605 605 -274
サーバ1: 20511.361秒
サーバ2: 30382.941秒
サーバ3: 18459.201秒
この場合では、総コア数が3倍あるサーバ3がサーバ1よりもわずかだけ性能が上回る。やはり Intel (質:1コアあたりの性能) v.s. AMD (量:コア数の多さ)の戦いになるようだ。
○サーバ1 (2 CPU x 4 コア = 8 コア)
CPU : Intel Xeon 5550 (2.66GHz / 8MB L3) x 2
Memory : 72GB (18 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○サーバ2 (2 CPU x 6 コア = 12 コア)
CPU : AMD Opteron 2435(2.6GHz / 6MB L3)x 2
Memory : 64GB(16 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○サーバ3 (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 13 for x86_64