以前の記事(こちら)で 10億点, 20億枝のグラフに対する SSSP(1対全最短路問題) の並列実行について書いてみたが、あまりにもマルチスレッドがうまくいかないことが分かった。そのときの TEPS はやはり低い。また Istanbul4(Opteron(tm) Processor 8439 SE) と Nehalem-EP(Intel(R) Xeon(R) CPU X5550 @ 2.67GHz) では倍以上の差が確認される(1thread時)。
グラフ : rand_1G_2G-1_1.gr(n=2^30, m=2^31-1, U=[1,1])
クエリ : SSSP(1) x 1 (始点1)
Time[sec.] parse construct sssp Istanbul4 1088.592 1363.551 1890.330 Nehalem-EP 1044.964 789.239 868.166 Nehalem-EP[2] 1044.964 820.822 29903.140
TEPS score[ME/s] parse construct sssp Istanbul4[1] 1.9727 1.5749 1.1360 Nehalem-EP 2.0545 2.7210 2.4736 Nehalem-EP[2] 2.0551 2.6163 0.0718
※コメント投稿者のブログIDはブログ作成者のみに通知されます