研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

OpenMP - その8。

2009-10-26 16:21:13 | Weblog
GCC4.4.1 から OpenMP3.0 なので、これからはこちらでの実験結果で見ていく。
OpenMP3.0 では、タスク並列化の機能が強化されているそう。

■実験環境
NehalemEP : Xeon(R) CPU X5550 @ 2.67GHz (4cores x 2sockets)
Intabul : Six-Core AMD Opteron(tm) Processor 2435 (6cores x 2sockets)

■コンパイラ
GCC: gcc-4.4.1 (OpenMP3.0)
ICC: icc-11.1 (OpenMP3.0)

■使用したデータ
グラフ:USA-road-d.NY.gr
クエリ:P2P x 256

■実験
dynamic: OpenMP ver. クエリ毎にスレッドを起動を行う。
static: OpenMP ver. スレッドを立ち上げておき、各スレッドで排他的にクエリを分け合う。
Pthreads: Pthreads ver.