最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

フカシギの数え方 その3

2013年02月15日 03時35分17秒 | Weblog
またまたお姉さん動画の数え上げについて(サイズは 16x16)。このフロンティア法による s-t パスの全列挙に関しては、HyperThreading の効果が高い。計算サーバ2(SandyBridge-EP 4CPU)と計算サーバ3(Westmere-EP 4CPU)の場合では、ほぼ2倍の性能になる。16x16 で1分切るためには、80 コアぐらいの並列計算が必要となる。

◯計算サーバ1:HyperThreading 未使用
./makegrid 17 | OMP_NUM_THREADS=12 ./para_simpath -a 1
np pinned grid n m make[s] enum[s]
12 Node-Major 17 289 544 0.000 119.025

◯計算サーバ1:HyperThreading 使用
./makegrid 17 | OMP_NUM_THREADS=24 ./para_simpath -a 1
np pinned grid n m make[s] enum[s]
24 Node-Major 17 289 544 0.000 100.261

◯計算サーバ2:HyperThreading 未使用
./makegrid 17 | OMP_NUM_THREADS=32 ./para_simpath -a 1
np pinned grid n m make[s] enum[s]
32 Node-Major 17 289 544 0.001 160.183

◯計算サーバ2:HyperThreading 使用
./makegrid 17 | OMP_NUM_THREADS=64 ./para_simpath -a 1
np pinned grid n m make[s] enum[s]
64 Node-Major 17 289 544 0.001 79.863

◯計算サーバ3:HyperThreading 未使用
./makegrid 17 | OMP_NUM_THREADS=40 ./para_simpath -a 1
np pinned grid n m make[s] enum[s]
40 Node-Major 17 289 544 0.001 90.164

◯計算サーバ3:HyperThreading 使用
./makegrid 17 | OMP_NUM_THREADS=80 ./para_simpath -a 1
np pinned grid n m make[s] enum[s]
80 Node-Major 17 289 544 0.001 46.661







◯計算サーバ1
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64

◯計算サーバ2
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3

◯計算サーバ3
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
VGA GLADIAC GTX 580 1.5GB
Supermicro 4 way 4U Tower Server
1400W redundant 電源
OS : CentOS 6.3
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする