最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

2010年を振り返って

2010年12月31日 17時39分12秒 | Weblog
1:単に計算能力の差だけでなく、スペースや消費電力から考慮しても新型の計算機に更新した方が得になる。上のクラスタ計算機(2008年)よりも、下のクラスタ計算機の方が性能、スペース、消費電力等の面で有利。





2:理論的な解析における優劣とソフトウェア実装後に計算機で実行したときの計算結果が大きく異なるという現象が見られる。
(1) 理論的な解析時に想定されている最悪な場合ということが計算機上で扱うことのできる問題の範囲では起こらない
(2) 計算量の評価において、演算量とデータ移動量が混同されている(一般的には後者の方がコストが高い)

3:実用的な最適化問題を解くために理論から実装, パラメータ設定, 大規模並列計算等の各分野の研究者が集結して総力戦が行われる場合が多くなった(特に日本以外)。

4:最適化ソフトウェアと高速計算技術の密な融合
マルチコア・プロセッサ, GPU コンピューティング, スーパーコンピュータ, クラウド・コンピューティング
○スーパーコンピュータの急激な性能向上
世界最高速は2ペタフロップスを超える     
○最適化ソフトウェアの圧倒的なパフォーマンス
全米データ(2,400万点, 5,800万枝)の 最短路計算 : 約3秒
超巨大データ(10億点, 20億枝)では 10分程度

コメント
この記事をはてなブックマークに追加

クラスタ計算機の作業について(空調機)

2010年12月30日 04時04分46秒 | Weblog
空調機の修理をかなり前に依頼して先週あたりに室外機のパーツの交換などを行われたようだが、いまだに2台の空調機の中の1台が正常に動作するようになっていない。というよりもむしろ状況が悪化しているので、以下のようにクラスタ計算機は一部を停止して運用を行っている。ただし新クラスタ計算機では大規模な実験を行っている。

○新クラスタ計算機(全ノード稼働中)
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64

○ SDPA クラスタ(4ノードのみ稼働中)
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
Disk : 6TB(RAID 5)
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.5 for x86_64

○ POWER クラスタ(停止中
4 Nodes, 8 CPUs, 32 CPU コア;
CPU : Intel Xeon E5345 2.33GHz (quad cores) x 2 / node
Memory : 16GB / node
HDD : 2TB(RAID 5) / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.5 for x86_64
コメント
この記事をはてなブックマークに追加

停電とネットワーク停止のお知らせ メールサーバートラブル

2010年12月29日 10時55分40秒 | Weblog
以下の停止期間は終わりまして、研究室のサーバ等は起動しておりますが、学科のメールサーバが不調のようです。現在大学宛にメールを送っていただいても受信が出来ない状況ですが、このメールサーバは私の管理下ではないので、こちらで出来る処置はありません。メールは gmail のアドレスの方にお送り下さい。

ネットワーク停止について
停止期間 : 12月26日(日)16:00 ~ 12月28日(火)16:00(予定)

【停電について】
停電日時 : 12月27日(月)8:00 ~ 17:00
停電範囲 : 後楽園キャンパス全館
コメント
この記事をはてなブックマークに追加

新クラスタ計算機との性能比較

2010年12月28日 02時02分54秒 | Weblog
今は停電中なので全サーバが停止しているが、以前行った数値実験の結果を用いて他の計算サーバとの性能比較を行う。

○問題1: esc32a_r2.dat-s (QAP に対する DNN 緩和問題)
○計算サーバ
実行時間 : 128989.8秒 = 35.8時間
SCM の作成 : 6870.4秒 : 5.3%
SCM のCholesky 分解 : 119750.7秒 : 92.8%
○新クラスタ計算機
実行時間 : 13994.3秒 = 3.8時間
SCM の作成 : 162.1秒 : 1.1%
SCM のCholesky 分解 : 13496.4秒 : 96.4%

○問題2: (量子化学に対するSDP緩和問題)
○SDPAクラスタ計算機
実行時間 : 49037.9秒 = 13.6時間
SCM の作成 : 46730.8秒 : 95.3%
SCM のCholesky 分解 : 617.0秒 : 1.2%
○新クラスタ計算機
実行時間 : 32379.1秒 = 8.99時間
SCM の作成 : 30735.4秒 : 94.9%
SCM のCholesky 分解 : 390.6秒 : 1.2%

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64



○計算サーバ (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 14 for x86_64

○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
Disk : 6TB(RAID 5)
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.5 for x86_64

コメント
この記事をはてなブックマークに追加

停電とネットワーク停止のお知らせ 再掲載

2010年12月27日 10時45分45秒 | Weblog
以下の情報を再掲載します。サーバ自体は自動復帰させることができるのですが、空調機は手動で起動する必要がありますので、28日の夕方に直接現地で作業します。空調機の方は修理したものの、まだ本調子ではないようですので注意が必要です。

【ネットワーク停止について】
停止期間 : 12月26日(日)16:00 ~ 12月28日(火)16:00(予定)

【停電について】
停電日時 : 12月27日(月)8:00 ~ 17:00
停電範囲 : 後楽園キャンパス全館
コメント
この記事をはてなブックマークに追加

巨大 SDP(H2O)と計算結果

2010年12月26日 04時59分09秒 | Weblog
以下のブロック対角構造を持つ大きな SDP(量子化学の T2Prime 条件が付いた水分子(H2O)の基底状態でのエネルギー計算)をこれまで何回か解いている。

問題名 : H2O.1A1.DZ.pqgt1t2p.dat-s


1: 2006 年に産総研 AIST Super Cluster M64 を用いて初めて解くことができた。

○ASC M-64 クラスタ
CPU : Itanium 2 1.3GHz x 8 CPU
メモリ : 16GB
ソフトウェア SDPARA 1.0.1

8 CPU を用いて実行時間は 2060237.619 sec. = およそ 24 日

2: 次に SDPA クラスタで 2008 年に解いてみたのだが、ソフトウェア側の進歩があって 2010 年まで高速化が続いた。

○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.5 for x86_64
ソフトウェア SDPARA 7.3.2



128 コアを用いて実行時間は 49,037.9s(16CPU x 8コア) ~ 13.6 時間となった。

3: その後に SDPA の完全 64bit 化を行ったので、時間はかかるのだが 1 サーバで解くことができるようになった。

○計算サーバ : SDPA 7.3.2 (64bit)
CPU : AMD Opteron 2435(2.6GHz / 6MB L3)x 2
Memory : 64GB(16 x 4GB / 800MHz)
OS : Fedora 12 for x86_64
ソフトウェア SDPA 7.3.2

809,261.3s(12コア) ~ 224.8時間(9.4日)

4: また 2010 年3月に京大 T2K スパコンの 2048 コアを用いてこの問題を解いた。

○ 京大 T2K スパコン
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64
ソフトウェア SDPARA 7.3.2

27,523.8s(128CPU x 16コア) ~ 7.6 時間

5: そして本年の締めくくりとして新クラスタ計算機で解いてみた。

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64



32,379.1s(16CPU x 12 コア) ~ 9時間

以上をまとめると以下の結果になる。京大 T2K スパコンと新クラスタ計算機ではコア数で 10 倍以上の差があるが実行時間はあまり変わらない。Intel の Westmere(新クラスタ計算機)は性能は予想通りの良さとなっている。

問題: H2O.1A1.DZ.pqgt1t2p.dat-s
2006年
○産総研 AIST Super Cluster M64
2,060,237.619s(8CPU) ~ 24 日
2010年
○SDPA クラスタ
49,037.9s(16CPU x 8コア = 128コア) ~ 13.6 時間
○京大 T2K スパコン
27,523.8s(128CPU x 16コア = 2048コア) ~ 7.6 時間
○計算サーバ
809,261.3s(12コア) ~ 224.8時間(9.4日)
○新クラスタ計算機
32,379.1s(16CPU x 12コア = 192コア) ~ 9時間
コメント
この記事をはてなブックマークに追加

研究室とクラスタ計算機

2010年12月25日 04時47分23秒 | Weblog
何年か振りに?研究室の整理を行った。以前の乱雑さを知っている方は別の部屋に見えるかもしれない。クラスタ計算機達と同居していることに驚かれる方も多いのだが、この他にも研究室の部屋は二つほどある。

入り口から見た研究室。入り口付近にクラスタ計算機と天井と空調機がある。


SDPA クラスタ計算機や他の計算サーバ及び Web サーバ等


ブレードサーバ型の新クラスタ計算機


さらに内側の作業スペース等。意外と中は広い

コメント
この記事をはてなブックマークに追加

新クラスタ計算機における SDPARA

2010年12月24日 00時19分42秒 | Weblog
以下は QAPLIB の esc32a に対する DNN 緩和問題である。

102208 = mDIM
14 = nBLOCK
-101740 193 129 129 161 65 193 225 225 161 193 193 225 257 = bLOCKsTRUCT

以下の計算サーバ上での SDPA 7.3.2 の計算時間は 143548.8秒で、その内 Cholesky 分解は 136246.8秒と全体の約 95% を占めている。

○サーバ (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 13 for x86_64

一方で、以下の新クラスタ計算機での SDPARA 7.3.2 の計算時間は 13994.4秒で、Cholesky 分解は 13496.5秒と全体の約 96% を占めている。

Time(sec) Ratio(% : MainLoop)
Predictor time = 13944.868864, 99.653808
Corrector time = 41.456622, 0.296260
Make bMat time = 162.190379, 1.159056
Make bDia time = 3.770260, 0.026943
Make bF1 time = 0.000000, 0.000000
Make bF2 time = 0.000000, 0.000000
Make bF3 time = 236.425215, 1.689559
Make bPRE time = 0.000000, 0.000000
Make rMat time = 1.527431, 0.010915
Make gVec Mul = 0.443347, 0.003168
Make gVec time = 0.682428, 0.004877
copy gVec time = 0.000017, 0.000000
copy bMat time = 240.352800, 1.717626
symm bMat time = 0.001681, 0.000012
Cholesky bMat = 13496.470459, 96.449432
Ste Pre time = 0.014044, 0.000100
Ste Cor time = 1.511216, 0.010800
solve = 71.359019, 0.509951
copy DyVec = 0.441331, 0.003154
sumDz = 1.906933, 0.013627
makedX = 2.474719, 0.017685
symmetriseDx = 1.916293, 0.013694
makedXdZ = 6.298036, 0.045007
xMatTime = 1.592994, 0.011384
zMatTime = 1.908064, 0.013636
invzMatTime = 0.000000, 0.000000
xMatzMatTime = 0.000000, 0.000000
EigxMatTime = 0.683886, 0.004887
EigzMatTime = 0.641332, 0.004583
EigxMatzMatTime = 0.000000, 0.000000
updateRes = 1.820102, 0.013007
EigTime = 1.325218, 0.009470
sub_total_bMat = 13831.122172, 98.840944
Main Loop = 13993.312551, 100.000000
File Check = 0.000000, 0.000000
File Change = 0.007925, 0.000057
File Read = 1.075853, 0.007688
File Trans = 3.619429, 0.025865
Total = 13994.396329, 100.007745

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント
この記事をはてなブックマークに追加

新クラスタ計算機での Graph500

2010年12月23日 05時07分59秒 | Weblog
Graph 500 のリファレンス実装の MPI 版を新クラスタ計算機を実行してみた。SCALE 値が大きくなると非常に実行時間が長くなるので、SCALE=18 (点数 2^18 = 262144)の結果を掲載する。実行時間は 14m36.435s となる。

SCALE: 18
edgefactor: 16
NBFS: 64
graph_generation: 5.3845 s
num_mpi_processes: 16
construction_time: 825.429 s
min_time: 0.200316 s
firstquartile_time: 0.20415 s
median_time: 0.206919 s
thirdquartile_time: 0.211234 s
max_time: 0.22163 s
mean_time: 0.207864 s
stddev_time: 0.00513509
min_nedge: 67108080
firstquartile_nedge: 67108080
median_nedge: 67108080
thirdquartile_nedge: 67108080
max_nedge: 67108080
mean_nedge: 67108080
stddev_nedge: 0
min_TEPS: 3.02793e+08 TEPS
firstquartile_TEPS: 3.17695e+08 TEPS
median_TEPS: 3.24321e+08 TEPS
thirdquartile_TEPS: 3.2872e+08 TEPS
max_TEPS: 3.35011e+08 TEPS
harmonic_mean_TEPS: 3.22846e+08 TEPS
harmonic_stddev_TEPS: 1.00484e+06
min_validate: 0.452902 s
firstquartile_validate: 0.454387 s
median_validate: 0.45865 s
thirdquartile_validate: 0.470509 s
max_validate: 0.531631 s
mean_validate: 0.473651 s
stddev_validate: 0.0295647

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント
この記事をはてなブックマークに追加

クラスタ計算機の作業について

2010年12月22日 03時34分05秒 | Weblog
1:クラスタ計算機用の空調機の調子が悪いので修理を依頼したら、新規部品の初期不良とかで修理後に完全に止まってしまった。半分以上のサーバを停止して1台野空調機のみで運用中。冬なので空調機が1台でも何とか運用ができている
2:SDPA クラスタで Myrinet-10G による MPI 通信が出来なくなったので、Myricom 社から最新の myri10ge と mx ドライバをダウンロードしてインストールすると復活した。これで SDPA クラスタでも Graph 500 の実行ができるようになった
3:新クラスタで torque 2.5.3 のインストールを行うが、SDPARA の torque による動作が何かおかしい。

追記:torque の動作は正常に直りました。
理由はわかりませんが、.bashrc の OMP_NUM_THREADS のサイズと以下のシェルスクリプトの OMP_NUM_THREADS 値が異なっているとダメなようです(以前は大丈夫でしたが)。

#!/bin/sh
#PBS -l ncpus=12
#PBS -l nodes=16
#PBS -q opt
export OMP_NUM_THREADS=12
cat $PBS_NODEFILE > /home/fujisawa/sdpa-src/sdpara.7.3.2.src-RC3/nodes.list
/usr/local/openmpi/bin/mpiexec -machinefile /home/fujisawa/machinefile --mca btl_openib_max_btls 4 /home/fujisawa/sdpa-src/sdpara.7.3.2.src-RC3/sdpara.goto -ds /home/fujisawa/data/quantum/LiH.1Sigma+.STO6G.pqgt1t2p.dat-s -o /home/fujisawa/sdpa-src/sdpara.7.3.2.src-RC3/out.LiH -p /home/fujisawa/sdpa-src/sdpara.7.3.2.src-RC3/param.sdpa
コメント
この記事をはてなブックマークに追加

停電とネットワーク停止のお知らせ

2010年12月21日 00時33分36秒 | Weblog
以下のように停電とネットワーク停止期間がありますので、以下のネットワーク停止期間には研究室の全サーバが停止します。復帰は28日の夕方の予定です。

【ネットワーク停止について】
停止期間 : 12月26日(日)16:00 ~ 12月28日(火)16:00(予定)

【停電について】
停電日時 : 12月27日(月)8:00 ~ 17:00
停電範囲 : 後楽園キャンパス全館
コメント
この記事をはてなブックマークに追加

新クラスタ計算機と SDPARA

2010年12月20日 02時13分42秒 | Weblog
新クラスタ計算機もインストール&設定作業等が進んできたので、そろそろ本格的に最適化ソフトウェアの開発、実験それに評価を行う作業に入っていきたい。まだ、このクラスタ計算機の能力を発揮できるような巨大 SDP は解いていないが、これまでの評価実験においてもまずまずの結果を出している。

ソフトウェア
○ SDPARA 7.3.1 + GotoBLAS 1.34 + MUMPS 4.9.2 + LAPACK 3.2.2
○ SDPARA 7.3.2 + GotoBLAS2 1.13 + MUMPS 4.9.2 + LAPACK 3.2.2

問題1:nug14_r2.dat-s (QAP の DNN 緩和)
SDPARA 7.3.1 + Infiniband 10Gbps : 139.05s
SDPARA 7.3.1 + Infiniband 40Gbps : 137.27s
SDPARA 7.3.2 + Infiniband 10Gbps : 132.90s
SDPARA 7.3.2 + Infiniband 40Gbps : 131.65s

問題2:nug15_r2.dat-s (QAP の DNN 緩和)
SDPARA 7.3.1 + Infiniband 40Gbps : 302.98s
SDPARA 7.3.2 + Infiniband 40Gbps : 296.99s

問題3:N.4P.DZ.pqgt1t2p.dat-s (量子化学)
SDPARA 7.3.1 + Infiniband 40Gbps : 583.80s
SDPARA 7.3.2 + Infiniband 40Gbps : 545.92s

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント
この記事をはてなブックマークに追加

新クラスタ計算機稼働開始 その3

2010年12月19日 10時19分30秒 | Weblog
SDPA と最短路以外でも以下のソフトウェアのインストールを行った。

○ MIP 関係
CPLEX 12.2
Gurobi 4.0.0
SCIP 2.0.0
Cbc 2.5
GLPK 4.45

その他に ParaSCIP や PPSCIP もインストールする予定。基本的には現在 SDPA クラスタと OS が同じということもあって、両者はバイナリ互換となっている(一部のソフトを除いて)。また、Graph 500 の MPI リファレンス実装もインストールすることになる。

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント
この記事をはてなブックマークに追加

新クラスタ計算機稼働開始 その2

2010年12月18日 10時32分13秒 | Weblog
新クラスタ計算機で以下のコンパイラやソフトウェアをインストールあるいは稼働できるように設定した(HOKKE-18 の会場からログインして作業した)。とりあえず Infiniband QDR 対応で SDPARA が高速に動作するようになった。時間があれば LINPACK 測定も行うかもしれない。最短路のプログラムは特に設定しなくても簡単に動作する。

○コンパイラ
gcc 4.1.2 (デフォルト)
gcc 4.5.1
Intel Compiler C++/Fortran 12.0.0

○MPI
OpenMPI 1.4.3 (Intel Compiler)
OpenMPI 1.4.3 (gcc)

○ソフトウェア
SDPA 7.3.3 + GotoBLAS2 1.13 or Intel MKL 10.3 + MUMPS 4.9.2 + LAPACK 3.2.2
SDPARA 7.3.2 + GotoBLAS2 1.13 or Intel MKL 10.3 + MUMPS 4.9.2 + LAPACK 3.2.2
SDPARA-C 1.0.1 + ATLAS 3.9.32 + METIS 4.0 + SPOOLES 2.2 + LAPACK 3.2.2

○新クラスタ計算機
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.5 for x86_64
コメント
この記事をはてなブックマークに追加

Nehalem 系対決

2010年12月17日 14時22分20秒 | Weblog
Westmere も一応 Nehalem 系として、以下の Nehalem 系で幾つかの比較実験を行った。計算サーバ2はクロック周波数は最も低いのだが、CPLEX が異様に遅いことがわかる(Linux の種類や カーネルのバージョンが異なるので単純に比較できないが)。あとのソフトウェアは若干計算サーバ2が遅めとは言え、クロック周波数相当の性能が出ている。

CPLEX 12.2
○問題 roll3000.mps (MIPLIB2003) : シングルスレッド
計算サーバ1:262.27s
MIP - Integer optimal, tolerance (0.0001/1e-06): Objective = 1.2890000000e+04
Current MIP best bound = 1.2888725219e+04 (gap = 1.27478, 0.01%)
Solution time = 262.27 sec. Iterations = 2280841 Nodes = 52851 (158)

計算サーバ2:495.21s
MIP - Integer optimal, tolerance (0.0001/1e-06): Objective = 1.2890000000e+04
Current MIP best bound = 1.2888725219e+04 (gap = 1.27478, 0.01%)
Solution time = 495.25 sec. Iterations = 2280841 Nodes = 52851 (158)

計算サーバ3:243.98s
MIP - Integer optimal, tolerance (0.0001/1e-06): Objective = 1.2890000000e+04
Current MIP best bound = 1.2888725219e+04 (gap = 1.27478, 0.01%)
Solution time = 243.98 sec. Iterations = 2280841 Nodes = 52851 (158)

CPLEX 12.2
○問題 roll3000.mps (MIPLIB2003) : マルチスレッド
計算サーバ1:28.49s
MIP - Integer optimal, tolerance (0.0001/1e-06): Objective = 1.2890000000e+04
Current MIP best bound = 1.2888884332e+04 (gap = 1.11567, 0.01%)
Solution time = 28.49 sec. Iterations = 1241049 Nodes = 21913 (12)

計算サーバ2:41.95s
MIP - Integer optimal, tolerance (0.0001/1e-06): Objective = 1.2890000000e+04
Current MIP best bound = 1.2888812671e+04 (gap = 1.18733, 0.01%)
Solution time = 41.95 sec. Iterations = 887391 Nodes = 19555 (15)

計算サーバ3:49.81s
MIP - Integer optimal, tolerance (0.0001/1e-06): Objective = 1.2890000000e+04
Current MIP best bound = 1.2888713992e+04 (gap = 1.28601, 0.01%)
Solution time = 49.81 sec. Iterations = 1224945 Nodes = 26182 (50)

-----------------------------------------------------------------------------------

GLPK 4.45
○問題 stein45.mps (MIPLIB2003) : シングルスレッド
計算サーバ1:30.2s
計算サーバ2:34.2s
計算サーバ3:28.9s
-----------------------------------------------------------------------------------

SDPA 7.3.3
◯問題 theta6.dat-s : シングルスレッド
計算サーバ1:58.05s
計算サーバ2:67.93s
計算サーバ3:53.18s

SDPA 7.3.3
◯問題 theta6.dat-s : マルチスレッド
計算サーバ1:9.98s
計算サーバ2:11.75s
計算サーバ3:15.68s


○計算サーバ1 (2 CPU x 6 コア = 12 コア)
CPU : Intel Xeon 5670 (2.93GHz / 12MB L3) x 2
Memory : 128GB (16 x 8GB / 1066MHz)
OS : CentOS 5.5 for x86_64

○計算サーバ2 (2 CPU x 4 コア = 8 コア)
CPU : Intel Xeon 5550 (2.66GHz / 8MB L3) x 2
Memory : 72GB (18 x 4GB / 800MHz)
OS : Fedora 14 for x86_64

○計算サーバ3 (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 965 (3.20GHz / 8MB L3) x 1
Memory : 12GB (6 x 2GB)
OS : CentOS 5.5 for x86_64
コメント (3)
この記事をはてなブックマークに追加