当研究室最速マシンはどちらかということで、ベンチマークしてみました。Istanbul での HugeTLBfs による改善率は大変大きいが、NehalemEP の方に軍配が上がる結果となった。Linpack では逆の結果になったようで、気になるところである。
Graph Data: USA-road-d.USA.gr (23,947,347 nodes 58,333,344 arcs)
Graph Data: USA-road-d.USA.gr (23,947,347 nodes 58,333,344 arcs)
◆ Execution Time [sec./query] 1 2 4 6 8 10 12 NehalemEP 2.58 1.36 0.72 - 0.42 - - NehalemEP(Huge) 2.33 1.23 0.65 - 0.37 - - Istanbul* 3.99 2.15 1.16 0.86 0.71 0.65 0.62 Istanbul*(Huge) 2.86 1.52 0.81 0.58 0.48 0.42 0.39
1.1コア使用時には、メモリのアロケーションは性能に影響するか。
2.2コア使用時には、別々のソケット上のコアを使用した方が良いか、それとも同一ソケット上が良いか?メモリのアロケーションは?
という感じです。Nehalem-EP と Nehalem-EP(Huge) の性能比率から考察すると、4 コアの性能値は2コア+2コアでの実行結果かな?という気がしますが正しいですか?
2. 片方のコア上でメモリ確保はされるので、もう片方が同一ソケット上にあるとどうかを判断できます。実験し次第アップします。
Nehalem に関しては、「2コア+2コア」に近いですが、「4コア」でもほとんど変わりません。