最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

スーパーグローバル大学創成支援プログラム

2014年09月30日 02時55分28秒 | Weblog
スーパーグローバル大学創成支援プログラム

平成26年度スーパーグローバル大学創成支援申請状況

平成26年度スーパーグローバル大学創成支援審査結果

トップ型(4億2千万円補助)
北海道大、東北大、筑波大、東京大、東京医科歯科大、東京工業大、名古屋大、京都大、大阪大、広島大、九州大、慶応義塾大、早稲田大

グローバル化けん引型(1億7千万円補助)
千葉大、東京外国語大、東京芸術大、長岡技術科学大、金沢大、豊橋技術科学大、京都工芸繊維大、奈良先端科学技術大学院大、岡山大、熊本大、国際教養大、会津大、国際基督教大、芝浦工業大、上智大、東洋大、法政大、明治大、立教大、創価大、国際大、立命館大、関西学院大、立命館アジア太平洋大
コメント
この記事をはてなブックマークに追加

新計算サーバ

2014年09月29日 02時45分45秒 | Weblog
複数のサーバ間で性能比較実験をしてみました。あまり大きくない問題では計算サーバ2が一番速いようです。反対に問題がある程度大きくなると計算サーバ1が有利となります。

◯ ソフトウェア SDPA 7.4.0

◯問題1:karate.dat-s
計算サーバ1:145.51s
計算サーバ2:137.36s
計算サーバ3:244.81s

◯問題2:DSJC500.9.dat-s
計算サーバ1:58.63s
計算サーバ2:46.88s
計算サーバ3:76.99s

◯問題3:Be.1S.SV.pqgt1t2p.dat-s
計算サーバ1:269.42s
計算サーバ2:402.02s
計算サーバ3:431.96s

◯計算サーバ1
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
Memory :1.5TB (32GB LRDIMM x 48 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0

◯計算サーバ2
Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4650 (8-core 2.70GHz 16MB cache) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.5

◯計算サーバ3
Westmere-EX マシン:Intel Xeon Westmere-EX 40 コアマシン
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
VGA GLADIAC GTX 580 1.5GB
Supermicro 4 way 4U Tower Server
1400W redundant 電源
OS : CentOS 6.5
コメント
この記事をはてなブックマークに追加

Intel Compiler 15.0.0 登場 その5

2014年09月28日 02時14分51秒 | Weblog
以下の新計算サーバで少しだけ実験をしてみました。

◯ ソフトウェア SDPA 7.4.0

◯問題1:karate.dat-s
gcc 4.8.2 + Intel MKL 11.2 : 145.83s
icc 15.0.0 + Intel MKL 11.2 : 161.01s

◯問題2:DSJC500.9.dat-s
gcc 4.8.2 + Intel MKL 11.2 : 73.35s
icc 15.0.0 + Intel MKL 11.2 : 71.67s

◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.8.2 + Intel MKL 11.2 : 65.39s
icc 15.0.0 + Intel MKL 11.2 : 65.94s

◯計算サーバ:Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
Memory :1.5TB (32GB LRDIMM x 48 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm





コメント
この記事をはてなブックマークに追加

P-sen センサー

2014年09月27日 06時08分38秒 | Weblog
キャンパス内に P-sen のセンサーが立ち始めました。






コメント
この記事をはてなブックマークに追加

SSD ES3000

2014年09月26日 00時13分32秒 | Weblog
高性能PCIe SSDフラッシュストレージ ES3000

以下の計算サーバは ES3000 2.4TB を2個搭載しています。OS は CentOS 7.0 搭載します。メモリは 48 枚付いておりますが、それでもメモリの多数枚による性能低下はほとんどないそうです。

Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
Memory :1.5TB (32GB LRDIMM x 48 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
コメント
この記事をはてなブックマークに追加

九州大学テクノロジーフォーラム2014

2014年09月25日 03時34分15秒 | Weblog
http://wallaby.aics.riken.jp/isp2s2/index.htmlと重なってますね。

九州大学テクノロジーフォーラム2014のご案内
-本学約60名の若手研究者による研究シーズ発表を行い企業のビジネスニーズのマッチングの場を
提供します-

平成26年度文部科学省研究大学強化促進事業の一環で「九州大学テクノロジーフォーラム2014」を開催
いたします。本フォーラムでは、本学約60名の若手研究者による、研究シーズ発表(※詳細は調整中)を
行い、 企業のビジネスニーズのマッチングの場を提供することにしています。
多数の企業関係者の皆さまのご来場をお待ちしております。
(※詳細の確定および申込受付開始は、10月中旬を予定しております)

◆日 時:2014年12月3日(水) 9:20~17:20

◆場 所:東京国際フォーラム ガラス棟会議室G404~410 (東京都千代田区丸の内3-5-1)

◆対 象:どなたでもご参加いただけます

◆参加費:無料
コメント
この記事をはてなブックマークに追加

QAPLIB tai40b

2014年09月24日 03時37分41秒 | Weblog
九大 CX400 での Cholesky 分解の性能値は 128GPU (NVIDIA K20m)で以下の通り。121 GPU で 11x11 のグリッドの方が速そうだが(おそらく 100TFlops を超える)、n が 121万以上と大変大きいので、121 ノードではメモリに入りきらないかもしれない。

[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6108.246sec --> 98703.346GFlops ###

高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)
コメント
この記事をはてなブックマークに追加

総合研究棟(理学系) 9月22日

2014年09月23日 01時52分52秒 | Weblog
九州大学総合研究棟(理学系)








コメント
この記事をはてなブックマークに追加

FX10 後継機

2014年09月22日 00時56分35秒 | Weblog
この件はどうなったのでしょうね?

JAXA様がスーパーコンピュータシステムを刷新

当社の「PRIMEHPC FX10」後継機を採用

当社はこのほど、独立行政法人 宇宙航空研究開発機構(理事長:奥村 直樹、所在地:東京都調布市、以下、JAXA)様の新スーパーコンピュータシステムとして、当社が開発中の「FUJITSU Supercomputer PRIMEHPC FX10(フジツウ スーパーコンピュータ プライムエイチピーシー エフエックステン)」(以下、「PRIMEHPC FX10」)の後継機を中核にしたシステムを受注しました。システム全体の理論ピーク性能は現行システムの約24倍となる3.4ペタフロップス(以下、PFLOPS)(注1)となり、これにより、JAXA様が必要とする大規模データ解析に向けた処理能力の向上を実現します。

なお、新スーパーコンピュータシステムは、段階的な導入を計画しており、2014年10月に一部のシステムが稼働し、2016年4月より全面稼働する予定です。
コメント
この記事をはてなブックマークに追加

二つの研究集会

2014年09月21日 01時00分35秒 | Weblog
二つの研究集会が時期的に重なっています。場所は同じ福岡市内ですが、少し離れています。

http://imi.kyushu-u.ac.jp/~kamiyama/nlp.html

「自然言語処理と最適化」
日時 : 平成26年10月2日および3日
場所 : 九州大学 伊都キャンパス 数理学研究教育棟 大講義室1
主催 : 九州大学 マス・フォア・インダストリ研究所
共催 : 数学・数理科学と諸科学・産業との協働によるイノベーション創出のための研究促進プログラム
目的: 自然言語処理と最適化理論の人的・技術的交流

感染症数理モデルの実用化と産業及び政策での活用のための新たな展開
Infectious disease modeling for practical applications in industry and policymaking

※ この研究集会はマス・フォア・インダストリ研究所 共同利用研究の公開プログラムです.

開催期間
2014年10月1日(水) ~ 10月3日(金)

開催場所
JR博多シティ会議場 10階 大会議場
コメント
この記事をはてなブックマークに追加

懇親会の場所

2014年09月20日 02時58分34秒 | Weblog
10月から12月は特に研究に関するイベントが多いので、夜の懇親会の場所をいろいろ探しています。以下の場所には大学から車で10分以内で着くことができます。




コメント
この記事をはてなブックマークに追加

日本オペレーションズ・リサーチ学会2015年春季研究発表会

2014年09月19日 00時52分13秒 | Weblog
次回は東京理科大学で開催されます。

日本オペレーションズ・リサーチ学会2015年春季研究発表会
日 程
2015年3月26日(木), 27日(金)
場 所 東京理科大学 (神楽坂キャンパス)
実行委員長 矢部 博(東京理科大学)
テーマ 「グローバル社会とOR」
コメント
この記事をはてなブックマークに追加

新サーバ

2014年09月18日 03時08分41秒 | Weblog
以下のマシンがもうすぐ納品予定です。グラフ解析(探索)や数理計画問題等で利用します。

Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
Memory :1.5TB (32GB LRDIMM x 48 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
コメント
この記事をはてなブックマークに追加

感染症数理モデルの実用化と産業及び政策での活用のための新たな展開

2014年09月17日 01時53分44秒 | Weblog
感染症数理モデルの実用化と産業及び政策での活用のための新たな展開
Infectious disease modeling for practical applications in industry and policymaking

※ この研究集会はマス・フォア・インダストリ研究所 共同利用研究の公開プログラムです.

開催期間
2014年10月1日(水) ~ 10月3日(金)

開催場所
JR博多シティ会議場 10階 大会議場

コメント
この記事をはてなブックマークに追加

CPLEX と前処理

2014年09月16日 00時01分46秒 | Weblog
CPLEX 12.6 を用いた前処理について。

1:問題の読み込み
CPLEX> read test.mps
Selected objective sense: MINIMIZE
Selected objective name: OBJROW
Selected RHS name: RHS
Selected range name: RANGE
Selected bound name: BOUND
Problem 'test.mps' read.
Read time = 0.18 sec. (17.45 ticks)

2:そのまま解く
CPLEX> opt
Tried aggregator 1 time.
MIP Presolve eliminated 37998 rows and 19332 columns.
MIP Presolve modified 18862 coefficients.
Reduced MIP has 22399 rows, 37039 columns, and 136502 nonzeros.
Reduced MIP has 35595 binaries, 0 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.27 sec. (156.13 ticks)
Probing fixed 15645 vars, tightened 2 bounds.
Probing changed sense of 3861 constraints.
Probing time = 1.16 sec. (242.84 ticks)
Tried aggregator 1 time.
MIP Presolve eliminated 9884 rows and 20502 columns.
MIP Presolve modified 1912 coefficients.
Reduced MIP has 12515 rows, 16537 columns, and 68075 nonzeros.
Reduced MIP has 15099 binaries, 1 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.12 sec. (72.35 ticks)
Probing fixed 120 vars, tightened 12 bounds.
Probing time = 0.31 sec. (85.87 ticks)
Tried aggregator 1 time.
MIP Presolve eliminated 1540 rows and 1070 columns.
Reduced MIP has 10975 rows, 15467 columns, and 64664 nonzeros.
Reduced MIP has 14041 binaries, 0 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.09 sec. (49.90 ticks)
Probing time = 0.05 sec. (8.69 ticks)
Clique table members: 7656.
MIP emphasis: balance optimality and feasibility.
MIP search method: dynamic search.
Parallel mode: deterministic, using up to 32 threads.
Root relaxation solution time = 0.18 sec. (88.40 ticks)

Nodes Cuts/
Node Left Objective IInf Best Integer Best Bound ItCnt Gap

0 0 142.0000 34 142.0000 1263
* 0+ 0 156.0000 142.0000 1263 8.97%
0 0 142.0000 34 156.0000 Cuts: 4 1323 8.97%
0 0 142.0000 22 156.0000 Cuts: 4 1329 8.97%
0 0 142.0000 34 156.0000 Cuts: 6 1338 8.97%
0 2 142.0000 34 156.0000 142.0000 1338 8.97%
Elapsed time = 5.64 sec. (2385.77 ticks, tree = 0.01 MB, solutions = 1)
2 4 142.0000 10 156.0000 142.0000 3052 8.97%
10 6 149.0000 9 156.0000 142.0000 7443 8.97%
12 6 146.6667 11 156.0000 142.0000 10543 8.97%
15 5 146.6667 11 156.0000 142.0000 14124 8.97%
25 3 cutoff 156.0000 142.0000 17415 8.97%
28 6 146.6667 11 156.0000 142.0000 20969 8.97%
38 7 146.6667 11 156.0000 142.0000 23871 8.97%
42 7 146.6667 11 156.0000 142.0000 26442 8.97%
46 7 cutoff 156.0000 142.0000 31093 8.97%
64 9 146.6667 11 156.0000 142.0000 43252 8.97%
Elapsed time = 11.51 sec. (6040.36 ticks, tree = 0.01 MB, solutions = 1)
96 9 cutoff 156.0000 142.0000 56745 8.97%

Implied bound cuts applied: 6
Lift and project cuts applied: 1
Gomory fractional cuts applied: 3

Root node processing (before b&c):
Real time = 5.40 sec. (2363.85 ticks)
Parallel b&c, 32 threads:
Real time = 8.92 sec. (5136.26 ticks)
Sync time (average) = 7.14 sec.
Wait time (average) = 0.00 sec.
------------
Total (root+branch&cut) = 14.32 sec. (7500.12 ticks)

Solution pool: 1 solution saved.

MIP - Integer optimal solution: Objective = 1.5600000000e+02
Solution time = 14.34 sec. Iterations = 60734 Nodes = 113
Deterministic time = 7500.22 ticks (523.10 ticks/sec)

最適目的関数値は 156 となる。

3:以下のように書くと前処理のみ実行されて、tmp.pre ファイルに書き込まれる。ただし、この場合では目的関数値は 24 減少する。
CPLEX> write tmp.pre
Problem written to file 'tmp.pre' (objective shift = 2.4000000000e+01).

4:tmp.pre を読み込むことによって、前処理後からの開始が可能となる。
CPLEX> read tmp.pre
Problem 'tmp.pre' read.
Read time = 0.03 sec. (1.60 ticks)

5:最適化の開始
CPLEX> opt
Tried aggregator 1 time.
Reduced MIP has 22399 rows, 37039 columns, and 136502 nonzeros.
Reduced MIP has 35595 binaries, 0 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.12 sec. (69.19 ticks)
Probing fixed 15645 vars, tightened 2 bounds.
Probing changed sense of 3861 constraints.
Probing time = 0.88 sec. (242.84 ticks)
Tried aggregator 1 time.
MIP Presolve eliminated 9884 rows and 20502 columns.
MIP Presolve modified 1912 coefficients.
Reduced MIP has 12515 rows, 16537 columns, and 68075 nonzeros.
Reduced MIP has 15099 binaries, 1438 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.12 sec. (72.38 ticks)
Probing fixed 120 vars, tightened 12 bounds.
Probing time = 0.19 sec. (85.85 ticks)
Tried aggregator 1 time.
MIP Presolve eliminated 1540 rows and 1070 columns.
Reduced MIP has 10975 rows, 15467 columns, and 64664 nonzeros.
Reduced MIP has 14041 binaries, 1426 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.09 sec. (49.92 ticks)
Probing time = 0.05 sec. (8.69 ticks)
Clique table members: 7656.
MIP emphasis: balance optimality and feasibility.
MIP search method: dynamic search.
Parallel mode: deterministic, using up to 32 threads.
Root relaxation solution time = 0.18 sec. (88.40 ticks)

Nodes Cuts/
Node Left Objective IInf Best Integer Best Bound ItCnt Gap

0 0 118.0000 34 118.0000 1263
* 0+ 0 132.0000 118.0000 1263 10.61%
0 0 118.0000 34 132.0000 Cuts: 4 1323 10.61%
0 0 118.0000 22 132.0000 Cuts: 4 1329 10.61%
0 0 118.0000 34 132.0000 Cuts: 5 1338 10.61%
0 2 118.0000 34 132.0000 118.0000 1338 10.61%
Elapsed time = 5.46 sec. (2448.31 ticks, tree = 0.01 MB, solutions = 1)
2 4 118.0000 10 132.0000 118.0000 3052 10.61%
8 4 cutoff 132.0000 118.0000 8413 10.61%
12 6 122.6667 13 132.0000 118.0000 14739 10.61%
19 3 cutoff 132.0000 118.0000 16883 10.61%
23 7 125.0000 9 132.0000 118.0000 20696 10.61%
34 6 122.6667 13 132.0000 118.0000 23743 10.61%
39 6 cutoff 132.0000 118.0000 29891 10.61%
40 5 cutoff 132.0000 118.0000 34402 10.61%
47 6 122.6667 13 132.0000 118.0000 42797 10.61%
68 6 118.0000 10 132.0000 118.0000 52373 10.61%
Elapsed time = 12.14 sec. (6499.56 ticks, tree = 0.02 MB, solutions = 1)
84 9 125.0000 9 132.0000 118.0000 62129 10.61%

Implied bound cuts applied: 6
Lift and project cuts applied: 1
Gomory fractional cuts applied: 3

Root node processing (before b&c):
Real time = 5.26 sec. (2426.41 ticks)
Parallel b&c, 32 threads:
Real time = 9.64 sec. (5701.12 ticks)
Sync time (average) = 8.14 sec.
Wait time (average) = 0.00 sec.
------------
Total (root+branch&cut) = 14.90 sec. (8127.53 ticks)

Solution pool: 1 solution saved.

MIP - Integer optimal solution: Objective = 1.3200000000e+02
Solution time = 14.91 sec. Iterations = 68200 Nodes = 100
Deterministic time = 8127.64 ticks (545.00 ticks/sec)

最適目的関数値は 132 となって、前回の値 156 からは 24 減少している。
コメント
この記事をはてなブックマークに追加