研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

OpenMP - その3。

2009-09-29 18:02:15 | Weblog
実行結果。残念ながら、Pthreads とはかなり差が付いてしまった。特に OpenMP ですべてのコアを使わなかったときの性能が良くないのは、なぜだろうか。バグが書き方がよろしくないのか、ひとまず晒しておく。

icc : 11.1
gcc : 4.1.2

◆OpenMP [sec.]
       [1]    [2]    [4]    [8]
gcc  4.546  6.148  4.605  2.951
icc  4.631  5.350  6.073  2.918


◆Pthreads [sec.]
       [1]    [2]    [4]    [8]
gcc  4.769  2.424  1.220  0.687
icc  4.528  2.280  1.142  0.674