最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Node Interleaving

2011年06月16日 04時19分44秒 | Weblog
Dell の PowerEdge のマニュアルには Node Interleaving について以下のように書いてある。

Node Interleaving

対称的なメモリ構成の場合、このフィールドが有効に設定されていると、メモリのインタリービングがサポートされます。このファイルが無効(デフォルト)に設定されていると、システムは NUMA(Non-Uniform Memory Architecture)(非対称)メモリ構成をサポートします。
メモ: 冗長メモリ機能を使用する際には、Node Interleaving(ノードのインタリービング)フィールドは Disabled(無効)に設定する必要があります。
-----------------------------------------------------------------------------------------------------------------------------------------------

そこで Magny-Cours 48 コアサーバで Node Interleaving 機能を ON と OFF の両方に設定して SDPA の比較実験を行なった。numactl コマンドなどの組み合わせが絡んでくると少し複雑になるのだが、この場合では明らかに Node Interleaving 機能を ON にした方が得になる。ただし、両者とも HT Assist は ON にしている。

○ソフトウェア SDPA 7.4β

○問題 : theta6.dat-s
Node Interleaving ON : 13.8秒
Node Interleaving OFF : 24.8秒

○問題 : Be.1S.SV.pqgt1t2p.dat-s
Node Interleaving ON : 11分30秒
Node Interleaving OFF : 18分4秒

○問題 : nug12_r2.dat-s
Node Interleaving ON : 2分15秒
Node Interleaving OFF : 4分35秒

○計算サーバ (4 CPU x 12 コア = 48 コア)
CPU : AMD Opteron 6174 (2.20GHz / 12MB L3) x 4個
メモリ : 256GB (16 x 16GB / 1066MHz)
OS : Fedora 15 for x86_64
コメント (3)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« Turbo Boost on Intel Xeon X... | トップ | SDPA クラスタ »
最新の画像もっと見る

3 コメント

コメント日が  古い順  |   新しい順
Unknown (後藤)
2011-06-16 06:28:29
numactl -i all ではまさに node interleave と同じことをしている(物理アドレスをチェックするとわかります)ので、これが機能するということは numactl -i all が有効に働いていないというこを意味します。
また node interleave の方が性能が良いということは、実は最適化が不十分である場合が多いです。
返信する
Unknown (藤澤)
2011-06-16 11:11:29
Node Interleaving OFF + numactl -i all だと Node Interleaving ON と同程度の性能になります。両者とも numactl 無しで実行したときの結果です。

ただし、解く問題によって特性が異なるので、汎用的な調整は難しそうに見えます。
返信する
Unknown (後藤)
2011-06-16 13:41:04
Node Interleave をするとローカルアクセスの半分程度のバンド幅になります。ですので、MPI を使って分散処理すれば、メモリバンド幅は2倍程度になる(要するに速度が倍になる)はずです。もちろんこの通りにいかない場合もあります。MPI の処理がカギです。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事