最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA (long int = 64bit) 化

2010年06月23日 00時57分59秒 | Weblog
SDPA の 64bit化というのは、64bit OS 上で 64bit アドレッシングを使うということではなくて(これはすでに対応済み)、ベクトル(行列)の index の変数を int (32bit) から long int(64bit) に変更するという意味になる。
SDPA 7.3.2 と SDPA 7.3.2(64bit) の比較実験は以下の通りであるが、何故か Istanbul(Opteron 8439) 搭載のマシンだけは、64bit の方が実行時間が遅くなる傾向が見られる。

○問題1:mcp2000-10.dat-s
計算サーバ1: SDPA 7.3.2 : 43.7s
計算サーバ1: SDPA 7.3.2(64bit) : 43.6s
計算サーバ2: SDPA 7.3.2 : 56.6s
計算サーバ2: SDPA 7.3.2(64bit) : 66.9s
計算サーバ3: SDPA 7.3.2 : 64.2s
計算サーバ3: SDPA 7.3.2(64bit) : 63.0s

○問題2:FH2+.1A1.STO6G.pqgt1t2p.dat-s
計算サーバ1: SDPA 7.3.2 : 96.8s
計算サーバ1: SDPA 7.3.2(64bit) : 96.2s
計算サーバ2: SDPA 7.3.2 : 59.9s
計算サーバ2: SDPA 7.3.2(64bit) : 62.4s
計算サーバ3: SDPA 7.3.2 : 147.9s
計算サーバ3: SDPA 7.3.2(64bit) : 146.3s

○計算サーバ1
CPU : Intel Xeon 5550 (2.66GHz / 8MB L3) x 2 (8コア)
Memory : 72GB (18 x 4GB / 800MHz)
OS : Fedora 13 for x86_64

○計算サーバ2
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4 (24コア)
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 13 for x86_64

○計算サーバ3
CPU : AMD Opteron 2384 (2.7GHz) x 2 (8 コア)
Memory : 32GB
OS : CentOS 5.5 for x86_64
コメント (4)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« マルチコア使いません | トップ | SCOPE@ つくば -未来を担う若... »
最新の画像もっと見る

4 コメント

コメント日が  古い順  |   新しい順
Unknown (後藤)
2010-06-23 02:06:06
想像ですが、32bit signed int → 64bit signed int でのキャストに時間がかかっているのかもしれません。この部分は符号拡張する必要があるのですが、AMD 系はこの処理がどうも苦手のようです。
返信する
Unknown (後藤)
2010-06-23 02:12:31
あとは、numa 関係のバラツキでしょうか。
返信する
Unknown (藤澤)
2010-06-23 02:34:46
そんなに多く実験したわけではないですが、現時点で分かっているのは以下の通りです。

1: AMD でも Opteron 2384(Shanghai)では遅くなる現象は確認されていない
2: 使用している BLAS は Intel MKL ライブラリ
3: mcp2000-10.dat-s という問題では、行列積等の計算がボトルネックとなる。よって、BLAS の実行時間が占める割合が増えると 64bit 時の性能劣化も大きくなる。
返信する
Unknown (後藤)
2010-06-23 02:43:50
では話は簡単で、MKL のカーネルが Istanbul と Shanghai とで異なるのでは?
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事