研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

NehalemEP v.s. Istanbul - その2。

2009-09-07 19:53:29 | Weblog
まずは Istanbul から。2コアでは同一ソケットの方が性能が良い。numactl で指定しないと "1core + 1core" で実行されてしまうが指定した方が良いようである。

Istanbul  [sec.]
                 total   ave.
* 0,1           539.38  2.107  (1core  + 1core )
  0,2           522.73  2.042  (2core  + 0core )
* 0,1,2,3       282.43  1.103  (2cores + 2cores)
  0,2,4,6       278.10  1.086  (4cores + 0core )
* 0,1,2,3,4,5   200.04  0.781  (3cores + 3cores)
  0,2,4,6,8,10  200.84  0.785  (6cores + 0core )


Nehalem の結果の方が納得がいく。2コア、4コアともに、うまく割り振った方が性能が良い。しかしながら、ほとんど性能は劣化せず。

Nehalem-EP  [sec.]
                 total   ave.
* 0,1           349.42  1.365  (1core  + 1core )
  0,2           343.25  1.341  (0core  + 2cores)
* 0,1,2,3       185.47  0.725  (2cores + 2cores)
  1,3,5,7       189.04  0.738  (4core  + 0core )


◆表の読み方
"仕様コアID" "256クエリの実行時間 "クエリあたりの実行時間" "コアの割り振り"
* … 理想的と思われる割り振り