研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

NUMA を考慮した並列実行 その3

2010-11-07 23:29:37 | Weblog
NY(#nodes: 264,346 | #arcs: 733,846) に対するAPSP(全対全最短路問題)の結果である。今回も非常に単純な分割を行っている(こちら)。

Graph: USA-road-NY.gr
Query: APSP(SSSP x #nodes)

・GCC: gcc-4.4.5
・Memory: HugeTLBfs(LargePage, 2MB)
・parallel: "#sockets"-processes x "#cores"-threads



同じアーキテクチャである Barcelona と Istanbul4、Corei7 と Nehalem-EP では、FLOPS 性能比と APSP 性能比が同じ特性を示しているようにみえる。そもそも浮動小数点数演算の性能値と、整数演算(最短路)の性能値を比べてもあまり意味がないが。