研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

1 node Graph500

2012-08-15 05:48:20 | Weblog
Graph500 list の更新から2ヶ月ほど経つが、ようやく納得する性能が出始めるようになってきた。上記のリストの 1node の結果に関して、CPU版としては私の実装が最速で SCALE 29 での 5.68 GE/s で 32 位である。しかしながら、Convey 社チームの FPGA 版が SCALE 27 での 7.85 GE/s (25位), 6.64 GE/s (28位), 6.00 GE/s (30位) が更に上に位置しているため、CPU 版の印象は薄いかもしれない。Graph500 だけではなく、消費電力あたりの TEPS で競う Green Graph 500 では 1node の結果が非常に有効であるため、引き続き高速化を行っている。現在の実装では, 4-way Westmere-EX で 8.0 GTEPS (median) ほど, 4-way Magny-Cours はその半分の 4.0 GTEPS (median) ほどの性能になった。

○ 4-way Westmere-EX サーバ (20-cores x 4-NUMA-nodes = 80-threads)
Intel(R) Xeon(R) CPU E7- 4870 @ 2.40GHz, 512 GB RAM

○ 4-way Magny-Cours サーバ ( 8-cores x 6-NUMA-nodes = 48-threads)
AMD Opteron(tm) Processor 6174 @ 2.20GHz, 256 GB RAM



最新の画像もっと見る

コメントを投稿