最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA 7.2.1 とマルチスレッド その3

2009年01月24日 02時24分24秒 | Weblog
SDPA 7.2.1 の改造も revision 3 まで来た。いろいろなアイデアがあるので、まだまだこれからといった感じになる。

Nehalem マシン
CPU : Intel Core i7-965 (Nehalem) 3.2GHz
メモリ : DDR3-1600 12GB (2GB x 6) トリプルチャンネル
OS : Fedora 10 for X86_64

○問題 theta6.dat-s
SDPA 7.2.1 (1スレッド : GotoBLAS 1.29)
54.687s (18反復)

SDPA 7.2.1 (4スレッド : GotoBLAS 1.29)
23.186s (18反復)

SDPA 7.2.1.rev2 (4スレッド : Pthread + GotoBLAS 1.29)
16.078s (18反復)

SDPA 7.2.1.rev3 (4スレッド : Pthread + GotoBLAS 1.29)
15.815s (18反復)

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする