研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

NUMA-affinity : 9th DIMACS refernce Solver との差

2010-11-29 17:24:39 | Weblog
今回は mbp とこちらの実装を比べてみる。mbp は1スレッド時は確かに高速であるが、マルチスレッドに対応していない。対応したとしても資源の競合から性能が出しにくいと予想している。

naive : 一般的な pthread 並列
numactl : numactl による affinity 設定
hugepage : naive-based の HugePage(LargePage) によるメモリ確保
affinity : sched_setaffinity() による affinity 設定
hugepage/affinity : hugepage かつ affinity
reference : 9th DIMACS reference code 'mbp' / A.V.Goldberg

istanbul の結果。


nehalemep の結果。


このようにいずれも並列数分ほどの性能差が確認される。