2010年3月25日のブログ記事一覧-最適化問題に対する超高速＆安定計算

某スパコンと SDPARA その５

2010年03月25日 23時07分54秒 | Weblog

以前の SDPARA の論文(計算機環境は今日と大きく異なるが)や近日中に発表する SDPARA の論文では、
１：Schur complement 行列の計算(F1, F2, F3 式)は scale up しやすい
２：Parallel Cholesky 分解(ScaLAPACK による)は、１と比べると scale up　しない。
という性質がある。これらの結果等から考察すると某スパコンでは F3 式の計算時間がもう少し速くなってもいいはずである。このシステムでは AMD Opteron(Barcelona) の 4-way なので、合計で 16 コアあるのだが、メモリや L3 キャッシュの性能を考えると、同時に使用するコア数はもう少し減らした方が良いかもしれない。しかし、Intel Xeon 系はコア数を最大まで使っても SDPA(SDPARA)では性能が上がることが多い。というわけで、やはり Intel 系の方がお薦めである(金額は高めだが)。

○ソフトウェア : SDPARA 7.3.2
○実験結果

SDPA クラスタ
16プロセス x 8スレッド : 4004.9s(24反復 : pdOPT)
F3 式計算時間 = 2625.7s, 65.6%
Cholesky 分解計算時間 = 1601.2s, 40.0%

某スパコン
128プロセス x 16スレッド : 1770.8s(24反復 : pdOPT)
F3 式計算時間 = 957.7s, 54.3%
Cholesky 分解計算時間 = 509.9s, 28.9%

○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.4 for x86_64

○ 某スパコン
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64

記事一覧 | 画像一覧 | フォロワー一覧 | フォトチャンネル一覧

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

アクセス
閲覧	689	PV
訪問者	400	IP
トータル
閲覧	5,061,219	PV
訪問者	1,296,677	IP

	【gooブロガー・先着】dアカウント連携でdポイント2,000pt
	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

某スパコンと SDPARA その５

カレンダー

Twitter

最新記事

検索

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

某スパコンと SDPARA その５

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ