前回紹介した SSCA#2 であるが更新版の v2.2 があったので、もう一度測定してみる。前回、実験したものに比べ随分性能が向上している。
環境:
CPU : Intel(R) Xeon(R) CPU X5460 @ 3.16GHz
GCC : 4.1.2
OS : linux 2.6.18-194.26.1.el5
計算量: ( BFS* + centrality ) x 1024 = ( 7/8O(m) + O(n) ) x 1024
※ BFS* は 7/8 しか探索しない BFS : 7/8 O(m)
※ centrality は DP で計算 : O(m)
● n=256,m=2048
./SSCA2 1 8 ---> Kernel4 : 18.196 M E/s (0.0252 sec.)
./SSCA2 8 8 ---> Kernel4 : 9.419 M E/s (0.049 sec.)
● n = 65536, m = 524288
./SSCA2 1 16 ---> Kernel4 : 9.158 M E/s (51.295 sec.)
./SSCA2 2 16 ---> Kernel4 : 7.286 M E/s (64.474 sec.)
./SSCA2 4 16 ---> Kernel4 : 10.479 M E/s (44.828 sec.)
./SSCA2 8 16 ---> Kernel4 : 19.044 M E/s (24.667 sec.)
● n = 262144, m = 2097152
./SSCA2 8 18 ---> Kernel4 : 16.536 M E/s (113.637 sec.)
環境:
CPU : Intel(R) Xeon(R) CPU X5460 @ 3.16GHz
GCC : 4.1.2
OS : linux 2.6.18-194.26.1.el5
計算量: ( BFS* + centrality ) x 1024 = ( 7/8O(m) + O(n) ) x 1024
※ BFS* は 7/8 しか探索しない BFS : 7/8 O(m)
※ centrality は DP で計算 : O(m)
● n=256,m=2048
./SSCA2 1 8 ---> Kernel4 : 18.196 M E/s (0.0252 sec.)
./SSCA2 8 8 ---> Kernel4 : 9.419 M E/s (0.049 sec.)
● n = 65536, m = 524288
./SSCA2 1 16 ---> Kernel4 : 9.158 M E/s (51.295 sec.)
./SSCA2 2 16 ---> Kernel4 : 7.286 M E/s (64.474 sec.)
./SSCA2 4 16 ---> Kernel4 : 10.479 M E/s (44.828 sec.)
./SSCA2 8 16 ---> Kernel4 : 19.044 M E/s (24.667 sec.)
● n = 262144, m = 2097152
./SSCA2 8 18 ---> Kernel4 : 16.536 M E/s (113.637 sec.)