以下の DNN 緩和問題に対して GPU 計算サーバ(6CPU + 12GPU) 3 台と OPT クラスタ(32CPU) の比較実験を行った。GPU計算サーバが3台あると、OPT クラスタに対して性能面でかなり有利になる。
◯QAPLIB (tai27a.dat-s) の DNN 緩和問題
mDIM = 247131
nBLOCK = 2
bLOCKsTRUCT = -324592 677
○ OPT クラスタ
Time(sec) Ratio(% : MainLoop)
Make bMat time = 1853.442709, 1.254029
Cholesky bMat = 145600.023573, 98.512174
Main Loop = 147799.016273, 100.000000
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(3台)
Time(sec) Ratio(% : MainLoop)
Make bMat time = 8977.100682, 8.706893
Cholesky bMat = 85170.470684, 82.606873
Main Loop = 103103.371226, 100.000000
○ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.8 for x86_64
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(2台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
◯QAPLIB (tai27a.dat-s) の DNN 緩和問題
mDIM = 247131
nBLOCK = 2
bLOCKsTRUCT = -324592 677
○ OPT クラスタ
Time(sec) Ratio(% : MainLoop)
Make bMat time = 1853.442709, 1.254029
Cholesky bMat = 145600.023573, 98.512174
Main Loop = 147799.016273, 100.000000
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(3台)
Time(sec) Ratio(% : MainLoop)
Make bMat time = 8977.100682, 8.706893
Cholesky bMat = 85170.470684, 82.606873
Main Loop = 103103.371226, 100.000000
○ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.8 for x86_64
◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(2台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64