最短路ソルバの version も 1.00 として、コア部分の高速化はまだまだ余地があるかもしれないが、形としてはほぼ完成といったところだ。
そこで DEBUG を含めてベンチマークを行った。
以前紹介した「GPU上で高速なブロック化フロイド・ワーシャル法」であるが、実験に用いたグラフが断定できたので、再度比較実験を行った。
これを 4.94sec. で解けるそうなので、思ったよりも性能が良い。
Random-13.0.0.gr ( 8192 nodes / 32768 arcs )
1. 円周上に点を配置
2. 円周上にサイクルを作成する ( 8192 arcs )
3. 残りの枝 ( 3m = 24576 arcs ) は、ランダム2点を選び張っていく
そこで DEBUG を含めてベンチマークを行った。
以前紹介した「GPU上で高速なブロック化フロイド・ワーシャル法」であるが、実験に用いたグラフが断定できたので、再度比較実験を行った。
これを 4.94sec. で解けるそうなので、思ったよりも性能が良い。
Random-13.0.0.gr ( 8192 nodes / 32768 arcs )
1. 円周上に点を配置
2. 円周上にサイクルを作成する ( 8192 arcs )
3. 残りの枝 ( 3m = 24576 arcs ) は、ランダム2点を選び張っていく
[GPU] CPU : Intel(R) Core(TM) i7 CPU 940 @ 2.93GHz GPU : nVIDIA GeForce GTX 280 OS : Windows XP x64 CUDA : 2.3 [CPU1] CPU : Intel(R) Core(TM) i7 CPU 940 @ 2.93GHz (8cores) GCC : 4.4.3 [CPU2] CPU : Intel(R) Xeon(R) CPU X5550 @ 2.67GHz (8cores) GCC : 4.4.3 1 2 4 8 [sec.] GPU 4.869 CPU1 10.222 5.104 3.218 2.901 CPU2 10.992 5.515 2.753 1.391
※コメント投稿者のブログIDはブログ作成者のみに通知されます