研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

1 node Graph500 その5

2012-09-04 10:54:52 | Weblog
大きな SCALE での性能が向上したので、再び blog 更新。



まずは WestmereEX での結果から。
max は 10 GTEPS を超えるのが当たり前になりつつある。
SCALE 27 以降の性能改善まであと一歩といったところ。

SCALE 26 時の median が 10.066 GTEPS かつ、有効電力が 1000.6 W であるので、10.060 GTEPS/kW となる。
これは 25位の convey の結果と同等。

○ 4-way Westmere-EX サーバ (20-cores x 4-NUMA-nodes = 80-threads)
Intel(R) Xeon(R) CPU E7-4870 @ 2.40GHz, 512 GB RAM




続いて、SandyBridge-EP での結果。
こちらは SCALE によって性能が上下せず非常に安定している。
クロックが低いにも関わらず非常に性能が良い。

SCALE 26 時の median が 5.607 GTEPS かつ、有効電力が 362.0 W であるので、15.489 GTEPS/kW となる。

○ 2-way SandyBridge-EP サーバ (16-cores x 2-NUMA-nodes = 32-threads)
Intel(R) Xeon(R) E5-2650 @ 2.00GHz, 256 GB RAM




お遊びでやったつもりが予想以上に GTEPS/kW が高く驚いた。
SCALE 21 時の median が 0.856 GTEPS かつ、AC アダプタ容量が 45 W であるので、単純に計算しても 19.022 GTEPS/kW となる。
思わぬ伏兵ができたので、これを鍛えて 20 GTEPS/kW 以上を狙うのも良いかもしれない。

○ MacbookAir 13inch (4-cores x 1-NUMA-nodes = 4-threads)
Intel(R) Corei5 2557M CPU @ 1.70GHz, 4 GB RAM
Macports GCC 4.5.4 を使用。
購入時 Lion でその後 Mountain Lion に update。