研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

超大規模ネットワーク n=2^30, m=2^31-1 その3

2010-11-23 07:27:58 | Weblog

以前の記事(こちら)で 10億点, 20億枝のグラフに対する SSSP(1対全最短路問題) の並列実行について書いてみたが、あまりにもマルチスレッドがうまくいかないことが分かった。そのときの TEPS はやはり低い。また Istanbul4(Opteron(tm) Processor 8439 SE) と Nehalem-EP(Intel(R) Xeon(R) CPU X5550 @ 2.67GHz) では倍以上の差が確認される(1thread時)。

グラフ : rand_1G_2G-1_1.gr(n=2^30, m=2^31-1, U=[1,1])
クエリ : SSSP(1) x 1 (始点1)

Time[sec.]
                 parse  construct       sssp
Istanbul4     1088.592   1363.551   1890.330
Nehalem-EP    1044.964    789.239    868.166
Nehalem-EP[2] 1044.964    820.822  29903.140
TEPS score[ME/s]
                 parse  construct       sssp
Istanbul4[1]    1.9727     1.5749     1.1360
Nehalem-EP      2.0545     2.7210     2.4736
Nehalem-EP[2]   2.0551     2.6163     0.0718