研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

全対全最短路問題 - その2

2010-04-30 02:14:57 | Weblog
最短路ソルバの version も 1.00 として、コア部分の高速化はまだまだ余地があるかもしれないが、形としてはほぼ完成といったところだ。

そこで DEBUG を含めてベンチマークを行った。
以前紹介した「GPU上で高速なブロック化フロイド・ワーシャル法」であるが、実験に用いたグラフが断定できたので、再度比較実験を行った。

これを 4.94sec. で解けるそうなので、思ったよりも性能が良い。

Random-13.0.0.gr ( 8192 nodes / 32768 arcs )
1. 円周上に点を配置
2. 円周上にサイクルを作成する ( 8192 arcs )
3. 残りの枝 ( 3m = 24576 arcs ) は、ランダム2点を選び張っていく

[GPU]
CPU : Intel(R) Core(TM) i7 CPU 940 @ 2.93GHz
GPU : nVIDIA GeForce GTX 280
OS : Windows XP x64
CUDA : 2.3

[CPU1]
CPU : Intel(R) Core(TM) i7 CPU 940 @ 2.93GHz (8cores)
GCC : 4.4.3

[CPU2]
CPU : Intel(R) Xeon(R) CPU X5550 @ 2.67GHz (8cores)
GCC : 4.4.3

           1      2      4      8 [sec.]
GPU    4.869
CPU1  10.222  5.104  3.218  2.901
CPU2  10.992  5.515  2.753  1.391