2009年3月5日のブログ記事一覧-最適化問題に対する超高速＆安定計算

SDPA 7.2.1 : マルチスレッド化の効果その３

2009年03月05日 14時01分55秒 | Weblog

前回と同様に実験を他のマシンでも行ったので、結果を掲載する。キャッシュ構成や容量、メモリバンド幅などが異なる三つの CPU だが、４スレッドでほぼ飽和する。反対に考えれば４スレッドまで並列化すればそこそこ性能は上がっていくようだ。

○実行マシン１：AMD Opteron 2384 (2.7GHz) : メモリ 32GB : CentOS 5.2 for x86_64
○実行マシン２：Intel Core i7 965(3.2GHz) : メモリ 12GB : Fedora 10 for x86_64
○実行マシン３：Intel Xeon 5460 (3.16GHz) : メモリ 48GB : CentOS 5.2 for x86_64

○SDPA 7.2.1.rev7 + GotoBLAS 1.29 + MUMPS 4.8.3 (4 スレッド : OMP_NUM_THREADS=4)

○実験データ
mDIM = 24503
nBLOCK = 3
bLOCKsTRUCT = 153 153 324
CH4.1A1.STO6G.noncore.pqg.dat-s

○実行マシン１
1: Schur complement 行列 : 2 スレッド; GotoBLAS : 4 スレッド
69m39.019s(20反復) = 3.46m / 反復
2: Schur complement 行列 : 4 スレッド; GotoBLAS : 4 スレッド
76m53.589s(26反復) = 2.94m / 反復
3.46 / 2.94 = 1.18倍

○実行マシン２
1: Schur complement 行列 : 2 スレッド; GotoBLAS : 4 スレッド
54m41.980s(21反復) = 2.59m / 反復
2: Schur complement 行列 : 4 スレッド; GotoBLAS : 4 スレッド
51m55.091s(21反復) = 2.45m / 反復
2.59 / 2.45 = 1.06倍

○実行マシン３
1: Schur complement 行列 : 2 スレッド; GotoBLAS : 4 スレッド
64m7.790s(22反復) = 2.94m / 反復
2: Schur complement 行列 : 4 スレッド; GotoBLAS : 4 スレッド
64m15.252s(22反復) = 2.91m / 反復
2.94 / 2.91 = 1.01倍

記事一覧 | 画像一覧 | フォロワー一覧 | フォトチャンネル一覧

アクセス
閲覧	668	PV
訪問者	452	IP
トータル
閲覧	5,057,090	PV
訪問者	1,294,146	IP

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA 7.2.1 : マルチスレッド化の効果その３

カレンダー

Twitter

最新記事

検索

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ

2009年3月
日	月	火	水	木	金	土
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA 7.2.1 : マルチスレッド化の効果 その３

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ

SDPA 7.2.1 : マルチスレッド化の効果その３