Graph500 list の更新から2ヶ月ほど経つが、ようやく納得する性能が出始めるようになってきた。上記のリストの 1node の結果に関して、CPU版としては私の実装が最速で SCALE 29 での 5.68 GE/s で 32 位である。しかしながら、Convey 社チームの FPGA 版が SCALE 27 での 7.85 GE/s (25位), 6.64 GE/s (28位), 6.00 GE/s (30位) が更に上に位置しているため、CPU 版の印象は薄いかもしれない。Graph500 だけではなく、消費電力あたりの TEPS で競う Green Graph 500 では 1node の結果が非常に有効であるため、引き続き高速化を行っている。現在の実装では, 4-way Westmere-EX で 8.0 GTEPS (median) ほど, 4-way Magny-Cours はその半分の 4.0 GTEPS (median) ほどの性能になった。
○ 4-way Westmere-EX サーバ (20-cores x 4-NUMA-nodes = 80-threads)
Intel(R) Xeon(R) CPU E7- 4870 @ 2.40GHz, 512 GB RAM
○ 4-way Magny-Cours サーバ ( 8-cores x 6-NUMA-nodes = 48-threads)
AMD Opteron(tm) Processor 6174 @ 2.20GHz, 256 GB RAM
○ 4-way Westmere-EX サーバ (20-cores x 4-NUMA-nodes = 80-threads)
Intel(R) Xeon(R) CPU E7- 4870 @ 2.40GHz, 512 GB RAM
○ 4-way Magny-Cours サーバ ( 8-cores x 6-NUMA-nodes = 48-threads)
AMD Opteron(tm) Processor 6174 @ 2.20GHz, 256 GB RAM