最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

3つの論文

2014年12月31日 00時45分33秒 | Weblog
以下は藤澤G、鈴村G、佐藤Gから1つずつ選んだ Best paper です(2011/11 〜 2014/12)。

Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Makoto Yamashita, Satoshi Matsuoka and Maho Nakata “High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems”, Proceedings of the 2012 ACM/IEEE conference on Supercomputing, SC’12, 2012年11月[DOI: 10.1109/SC.2012.67]
大規模な数理最適化問題 (半正定値計画問題: SDP) に対する並列ソルバの開発と評価。SDPは現在最も注目されている数理最適化問題の一つであり、組合せ最適化、データマイニング、量子化学,制御分野など非常に幅広い応用を持っている。今回、計算量とデータ移動量の正確な推定、疎性やサイズなどのデータ特性と性能値の見極め等のアルゴリズムを開発することによって、世界最高性能の並列ソルバの開発に成功し、東工大スパコン TSUBAME2.0上で 533TFlops(4080GPU)を達成した。

Koji Ueno and Toyotaro Suzumura "Highly Scalable Graph Search for the Graph500 Benchmark" HPDC 2012 (The 21st International ACM
Symposium on High-Performance Parallel and Distributed Computing), 2012/6, Delft, Netherlands
Graph500 においてスケール可能な2次元分割をTSUBAME2.0上に提案・実装を行った。512ノードで頂点数2^36(68.7 billion),エッジ数2^40(1.1 trillion)のグラフ(Graph500のScale 36)のBFS(幅優先探索)を24.12秒で計算した.

Keita Iwabuchi, Hitoshi Sato, Yuichiro Yasui, Katsuki Fujisawa, Satoshi Matsuoka, “NVM-based Hybrid BFS with Memory Efficient Data Structure”, 2014 IEEE International Conference on BigData (IEEE BigData 2014), 2014. (in press)
不揮発性メモリデバイス向けのHybrid BFS Algorithmに対し、省メモリなデータ構造とI/Oの最適化を行うことにより、
ホストのメモリ容量の4倍程度を超えるようなさらなる大規模グラフサイズでも14%程度の性能低下に抑えられることを示した。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

高性能演算サーバシステム 可視化サーバ

2014年12月30日 02時06分13秒 | Weblog
私も以下の可視化サーバに関してはあまり知りませんが、可視化サーバの運用が開始されました。

高性能演算サーバシステム 可視化サーバ 予約システムの運用開始について

九州大学情報基盤研究開発センターでは,高性能演算サーバシステムにおいて大容量
メモリ・長時間実行することができる可視化サーバを5台提供し,GUI等のソフトウェ
アを実行することが可能となっております.

 http://www.cc.kyushu-u.ac.jp/scp/system/general/CX/how_to_use/kashika.html

この度,5台の可視化サーバのうち,2台について予約システムを試験的に導入・運用
します.これにより次のような,利用者の利便性向上及び資源の有効活用を図ること
が可能となります.

 ・煩雑な申請・審査が不要
 ・希望する期間・時間帯のみを予約することが可能
 ・SSH及びリモートデスクトップで利用可能
 ・プロジェクト等のグループ複数人での同時利用が可能
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

CX400 での SDPARA その5

2014年12月29日 02時25分39秒 | Weblog
理由はわかりませんが、1回目よりも2回目の実行の方が少しだけ性能が落ちてます。。。

◯384GPU
1回目:11月27日
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3756.253sec --> 296873.895GFlops ###
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3733.636sec --> 298672.240GFlops ###
2回目:12月26日
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3796.980sec --> 293689.593GFlops ###
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3790.625sec --> 294181.923GFlops ###

問題のサイズ
1495602 = mDIM
1 = nBLOCK
3069 = bLOCKsTRUCT

高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Graph500 報道記事

2014年12月28日 02時23分07秒 | Weblog
日刊工業新聞 2014年12月16日
九州大、ビッグデータ処理用ソフトがベンチマークテストで処理性能世界1位
http://www.nikkan.co.jp/news/nkx0220141216eaae.html

朝日新聞デジタル 2014年12月16日
九州大、ビッグデータ処理用ソフトがベンチマークテストで処理性能世界1位
http://www.asahi.com/tech_science/nikkanko/Cnikkanko20141216010.html

   日経コンピュータ ニュース 2014年6月24日
   ビッグデータ解析性能を競う「Graph 500」で「京」が初の首位
http://itpro.nikkeibp.co.jp/article/NEWS/20140624/566162/

PC Watch 2014年6月25日
ビッグデータ処理性能のスパコンランキングで日本勢が二冠
http://pc.watch.impress.co.jp/docs/news/20140625_654944.html
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「大規模データ処理を実現する超省電力ハードウェアの将来像」

2014年12月27日 02時07分54秒 | Weblog
産総研STARシンポジウム
「大規模データ処理を実現する超省電力ハードウェアの将来像」


開催概要
日 時 2015年1月26日(月) 10:00~17:30
場 所 コクヨホール(東京都港区港南1-8-35/JR品川駅港南口(東口)徒歩5分)
主 催 独立行政法人 産業技術総合研究所/日本を元気にする産業技術会議
後 援 日本経済新聞社
参加費 無料
定 員 300名(定員になり次第、募集を締切ります)


プログラム
 10:00~10:20 開会挨拶 中鉢 良治(産総研 理事長)
来賓挨拶 安永 裕幸 氏(経済産業省 産業技術環境局 大臣官房審議官)
     川口 悦生 氏(文部科学省 研究振興局 計算科学技術推進室長)

 10:20~10:50 講演「IMPULSEが描く未来の大規模超省電力データ処理」
 金山 敏彦(産総研 副理事長/IMPULSE プログラムディレクター)

 10:50~12:00 セッション1:不揮発メモリ
 "電圧制御スピンRAM"
 湯浅 新治(産総研 ナノスピントロニクス研究センター 研究センター長)
 "電圧制御トポロジカルRAM"
 富永 淳二(産総研 ナノエレクトロニクス研究部門 首席研究員)
 "第一原理計算による材料開発の加速"
 浅井 美博(産総研 ナノエレクトロニクス研究部門 副研究部門長)

 12:00~13:00 <休憩>

 13:00~13:40 招待講演1「ポスト京の先のポストムーアに向けた
      データ中心コンピューティングとTsubame3」
 松岡 聡 氏(東京工業大学 学術国際情報センター 教授)

 13:40~14:25 セッション2:省電力ロジック
 "フロントエンド三次元集積"
 安田 哲二(産総研 ナノエレクトロニクス研究部門 研究部門長)
 "次世代TCADによるデバイス開発の加速"
 福田 浩一(産総研 ナノエレクトロニクス研究部門 主任研究員)

 14:25~14:45 <休憩>

 14:45~15:25 招待講演2「北の大地で実現する高効率なデータセンターの未来」
 田中 邦裕 氏(さくらインターネット株式会社 代表取締役社長)

 15:25~16:15 セッション3:次世代データセンター
 "超高集積・超広帯域光ネットワーク"
 並木 周(産総研 ネットワークフォトニクス研究センター 研究センター長)
 "革新的ハードウェアがデータセンターにもたらすインパクト"
 工藤 知宏(産総研 情報技術研究部門 研究部門長)

 16:15~17:30 パネル討論「大規模化するデータ処理の課題と展望」
・パネリスト:松岡 聡 氏(東京工業大学 学術国際情報センター 教授)
       田中 邦裕 氏(さくらインターネット株式会社 代表取締役社長)
       藤澤 克樹 氏(九州大学 マス・フォア・インダストリ研究所 教授)
       安田 哲二(産総研 ナノエレクトロニクス研究部門 研究部門長)
・モデレータ:津田 建二 氏(株式会社セミコンダクタポータル 編集長)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Graph500 Wikipedia

2014年12月26日 00時19分24秒 | Weblog
誰が作成されたのでしょうか?(本当に知らない)

Graph500 Wikipedia

Graph500 IT 用語辞典

近々、組織変更が必要になります。
http://www.graphcrest.jp/jp/



コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

スマートモビリティアジア2015『福岡からの挑戦 ~持続可能な社会システム構築に向けて~』

2014年12月25日 16時14分56秒 | Weblog
============================================
スマートモビリティアジア2015『福岡からの挑戦 ~持続可能な社会システム構築に向けて~』
============================================
◆会 期: 2015年1月8日(木), 9日(金)
◆会 場: アクロス福岡 円形ホール、国際会議場
◆主 催: スマートモビリティアジア実行委員会 実行委員長 安浦寛人
    (九州大学 理事・副学長、福岡地域戦略推進協議会スマートシティ部会 部会長、
     福岡アジア都市研究所 理事長)
◆共 催:  福岡地域戦略推進協議会(FDC) スマートシティ部会
    九州大学共進化社会システム創成拠点(CESS)
     ビッグデータ & オープンデータ研究会 in 九州(BODIK)
◆プログラム:リーフレットをご参照ください。

◆参加費:無料 

          ※お申込み〆切:12/26(金)

◆お問い合わせ:スマートモビリティアジア実行委員会(㈱産学連携機構九州)
Phone : 092-834-2388 Fax : 092-834-2389
Email:plan@k-uip.co.jp
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本オペレーションズ・リサーチ学会2015年春季研究発表会

2014年12月24日 00時10分42秒 | Weblog
日本オペレーションズ・リサーチ学会2015年春季研究発表会

日本OR学会 統一テーマ「オリンピック・パラリンピックとOR」

春季研究発表会 特別テーマ「グローバル社会とOR」

日程
2015年3月26日(木),27日(金)

会場
東京理科大学神楽坂キャンパス

特別講演者
日本OR学会会長 大宮 英明 氏 (3月26日)
東京理科大学理事長 中根 滋 氏 (3月27日)
近藤賞受賞者 (3月27日)

懇親会
2015年3月26日(木)に懇親会を行います. 詳細はこちらをご覧ください.

発表申込み受付期間
2014年12月1日(月)~2015年1月7日(水)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ビッグデータ関連

2014年12月23日 00時31分50秒 | Weblog
購入できるものは幾つか購入してみます。

トヨタ自動車、ビッグデータを活用した新しい情報サービスの提供を開始

特集 ICTがもたらす世界規模でのパラダイムシフト

トヨタ自動車(株)が手がける「ビッグデータ交通情報サービス」は、同社のテレマティクスサービス「G-BOOK」を通じて収集された車両の位置や速度等の情報から生成されるリアルタイム交通情報や、通れた道マップ、交通量マップ、ABS等作動地点マップや地図情報などを利用することができるクラウド型のサービスであり、企業及び地方公共団体に対し平成25年6月より提供を開始している

株式会社Agoop - アグープ,ビジネスインテリジェンス,データ
月間数億件のデータ収集・解析・見える化でビッグデータソリューションを提供します
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

CX400 での SDPARA その4

2014年12月22日 16時20分58秒 | Weblog
全実行用のキューなのであまり参考にならないかもしれませんが、以下のようなシェルスクリプトファイルで CX400 の 384 GPU の実行を行っています。

#!/bin/bash
#PJM -L "rscgrp=cx-g-all"
#PJM -L "vnode=384"
#PJM -L "vnode-core=16"
#PJM -P "vn-policy=abs-unpack"
#PJM -L "elapse=300:00"
#PJM -j
#PJM -X
#PJM -o gpu.sample_max_dual.384.1
#PJM -e gpu.err.sample_max_dual.384.1
#PJM --no-stging

source /home/etc/intelMPI.sh

NUM_NODES=$PJM_VNODES
NUM_CORES=16
NUM_PROCS=384
NUM_THREADS=16

export I_MPI_PERHOST=`expr $NUM_CORES / $NUM_THREADS`
export I_MPI_FABRICS=shm:ofa
export I_MPI_PIN_DOMAIN=omp
export I_MPI_PIN_CELL=core

export OMP_NUM_THREADS=$NUM_THREADS
export KMP_STACKSIZE=8m
export KMP_AFFINITY=compact
export LD_LIBRARY_PATH=.:/usr/local/cuda/lib64:/usr/local/cuda/lib:/usr/local/intel/composer_xe_2011_sp1.11.339/mkl/lib/intel64:/usr/local/intel/composer_xe_2011_sp1.11.339/compi
ler/lib/intel64:/home/usr2/i70322a/sdpa-src/sdpara.7.5.0.src-RC2G-new:/home/usr2/i70322a/cuda/lib64:$LD_LIBRARY_PATH


mpdboot -n $NUM_NODES -f ${PJM_O_NODEINF} -r /bin/pjrsh
mpiexec -n $NUM_PROCS /home/usr2/i70322a/sdpa-src/sdpara.sdpara.7.6.0.src-RC1G/sdpara -ds /home/usr2/i70322a/data/Fujitsu/sample_max_dual.dat-s -o /home/usr2/i70322a/sdpa-src/sdp
ara.sdpara.7.6.0.src-RC1G/out.sample_max_dual.dat-s.384.1 -p /home/usr2/i70322a/sdpa-src/sdpara.sdpara.7.6.0.src-RC1G/param.sdpa -id /home/usr2/i70322a/sdpa-src/sdpara.sdpara.7.6
.0.src-RC1G/sdpara.init > /home/usr2/i70322a/sdpa-src/sdpara.sdpara.7.6.0.src-RC1G/output.sample_max_dual.dat-s.384.1
mpdallexit



◯ Parallel Cholesky Factorization


高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

1月 IMI Colloquium

2014年12月21日 01時19分03秒 | Weblog
1月 IMI Colloquium

日時:2015年1月21日(水)
16:45-17:45
場所:九州大学 マス・フォア・インダストリ研究所
大講義室1(数理・IMI図書館棟3F)
講師:稲田 禎一 氏(日立化成(株)新事業本部)

講演タイトル:弱条件組合せ線形計画法による配合設計
-数学者は行列のできるラーメン屋になれるか?-

講演要旨:
いくつかの素材を組み合わせて、短期間に狙い通りのものを作れるか?これがビジネスの成否を分けることは最先端の半導体用材料でもラーメンスープでも全く同じである。しかし、数限りない素材の中からなにを選ぶか?どれだけ加えるかを逐一検討するのは、気の遠くなるような作業である。我々は、この作業を効率化するために、弱条件組合せ線形計画法による配合設計システムを構築し開発現場でその効果を試した。本講演では最先端の半導体材料開発の現状と、そこでの数学の応用について述べると共に、数学的手法が、素材の組合せを利用した産業全般に応用可能であることを概説したい。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

総合研究棟(理学系) 12月中旬

2014年12月20日 01時20分14秒 | Weblog
工事の方は順調に進んでいるようです。移転の方は順調に行くかは不明??です。











コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Software in Mathematics Demonstration Track in Hakata Workshop 2015

2014年12月19日 03時09分27秒 | Weblog
Software in Mathematics Demonstration Track in Hakata Workshop 2015

この企画について

数学においても定理や理論をコンピュータ言語で実装する必要性が増しています. 社会への数学理論の還元だけでなく, 実装により数学理論が可視化できさらに数学理論が進化することがしばしばあるからです.
 今回の組合せセミナーでは, セミナー参加者の交流をさらに深めるために, 研究をする上で作製した数学ソフトウェアを発表・展示する機会を設けようと思います.
 「数学ソフトウェア」と聞くとMathematicaやMatlabのような完成度の高く汎用性のあるものを想像するかもしれませんが, ここではそういったものでなくてもかまいません. 著作権違反のコピーではだめですが, 新規性や独創性等も要求しません. 「○○という数学分野を研究するために, △△というコンピュータ言語でプログラムを書いてみました」や「卒論・修論を書くためにこんな数学に関するプログラムを書きました」といった軽い気持ちで書いたものでもかまいません.

詳細

日時
2015年2月15日(日)
場所
リファレンス駅東ビル 会議室 I(2階)
(福岡市博多区博多駅東1丁目16-14)
形式
ポスター発表の形式です. ただし, ポスターではなくA4用紙4~5枚程度でプログラムの詳細を記載したものを用意して張っていただきます. また, 発表者にはこちらからプロジェクターを貸し出しますので, プロジェクターに自分のプログラムやその出力を映して発表してください. パワーポイント等のプレゼンテーションソフトを使いながら説明してもかまいません.
昨年 Software in Mathematics Demonstration Track in Hakata Workshop 2014 を 行いました. 興味のある方は こちらもご覧ください.
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

九州大、ビッグデータ処理用ソフトがベンチマークテストで処理性能世界1位

2014年12月18日 02時13分40秒 | Weblog
九州大、ビッグデータ処理用ソフトがベンチマークテストで処理性能世界1位

九州大学は、東京工業大学、理化学研究所と共同開発したビッグデータ(大量データ)処理用のソフトウエアを使って、スーパーコンピューターなど計算機上で処理するベンチマークテストを実施し、九州大のサーバーが処理性能で世界1位となった。
 同テストは単位消費電力当たりのグラフ処理性能を競うベンチマーク「グリーン グラフ500」ビッグデータ部門。また、単位指標当たりのグラフ処理を競うベンチマーク「グラフ500」によるテストでは理研のスパコン「京」が2位となった。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi Optimizer Ver.6.0

2014年12月17日 00時46分35秒 | Weblog
Gurobi 6.0 がリリースされたので、現在解いている問題に関して、CPLEX 12.6 と比べてみた。Huawei マシンで 60 スレッドによる並列計算による実行。
この種の問題に関しては CPLEX の方が性能が良い。

◯Gurobi Optimizer Ver.6.0
gurobi> m.setParam('Threads', 60);
Changed value of parameter Threads to 60
Prev: 0 Min: 0 Max: 1024 Default: 0
gurobi> m1 = read('nec-test.mps')
gurobi> m1.optimize()
Optimize a model with 60397 rows, 56371 columns and 242909 nonzeros
Coefficient statistics:
Matrix range [1e+00, 5e+08]
Objective range [1e+00, 1e+01]
Bounds range [1e+00, 1e+09]
RHS range [1e+00, 1e+09]
Warning: Model contains large matrix coefficients
Consider reformulating model or setting NumericFocus parameter
to avoid numerical issues.
Presolve removed 42042 rows and 27398 columns
Presolve time: 1.10s
Presolved: 18355 rows, 28973 columns, 114275 nonzeros
Variable types: 1342 continuous, 27631 integer (27631 binary)

Root relaxation: objective 1.420000e+02, 5423 iterations, 1.59 seconds

Nodes | Current Node | Objective Bounds | Work
Expl Unexpl | Obj Depth IntInf | Incumbent BestBd Gap | It/Node Time

0 0 142.00000 0 18 - 142.00000 - - 2s
H 0 0 156.0000000 142.00000 8.97% - 3s
0 0 142.00000 0 42 156.00000 142.00000 8.97% - 3s
0 0 142.00000 0 18 156.00000 142.00000 8.97% - 4s
0 0 142.00000 0 18 156.00000 142.00000 8.97% - 5s
0 0 142.00000 0 18 156.00000 142.00000 8.97% - 5s
0 0 142.00000 0 18 156.00000 142.00000 8.97% - 5s
0 0 142.00000 0 30 156.00000 142.00000 8.97% - 5s
0 0 142.00000 0 30 156.00000 142.00000 8.97% - 6s
0 2 142.00000 0 30 156.00000 142.00000 8.97% - 6s
7 9 142.00000 6 42 156.00000 142.00000 8.97% 485 10s
19 11 142.00000 9 42 156.00000 142.00000 8.97% 913 15s
29 13 142.00000 11 18 156.00000 142.00000 8.97% 1148 20s
77 16 142.00000 19 48 156.00000 142.00000 8.97% 810 30s
120 15 148.00000 23 54 156.00000 143.66667 7.91% 820 36s
148 6 148.00000 24 48 156.00000 143.66667 7.91% 866 41s
158 4 150.00000 27 131 156.00000 143.66667 7.91% 890 45s
164 3 152.41176 29 264 156.00000 148.00000 5.13% 910 54s
167 2 153.00000 30 43 156.00000 148.00000 5.13% 908 58s
171 1 cutoff 31 156.00000 148.00000 5.13% 927 60s

Cutting planes:
Gomory: 2
Mod-K: 2

Explored 185 nodes (173474 simplex iterations) in 63.47 seconds
Thread count was 32 (of 120 available processors)

Optimal solution found (tolerance 1.00e-04)
Best objective 1.560000000000e+02, best bound 1.560000000000e+02, gap 0.0%


◯CPLEX 12.6
CPLEX> opt
Tried aggregator 1 time.
MIP Presolve eliminated 37998 rows and 19332 columns.
MIP Presolve modified 18862 coefficients.
Reduced MIP has 22399 rows, 37039 columns, and 136502 nonzeros.
Reduced MIP has 35595 binaries, 0 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.18 sec. (156.13 ticks)
Probing fixed 15649 vars, tightened 2 bounds.
Probing changed sense of 3908 constraints.
Probing time = 0.67 sec. (152.98 ticks)
Tried aggregator 1 time.
MIP Presolve eliminated 9884 rows and 20502 columns.
MIP Presolve modified 1912 coefficients.
Reduced MIP has 12515 rows, 16537 columns, and 68075 nonzeros.
Reduced MIP has 15099 binaries, 1 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.08 sec. (72.35 ticks)
Probing fixed 120 vars, tightened 12 bounds.
Probing time = 0.14 sec. (85.87 ticks)
Tried aggregator 1 time.
MIP Presolve eliminated 1540 rows and 1070 columns.
Reduced MIP has 10975 rows, 15467 columns, and 64664 nonzeros.
Reduced MIP has 14041 binaries, 0 generals, 0 SOSs, and 0 indicators.
Presolve time = 0.06 sec. (49.90 ticks)
Probing time = 0.05 sec. (8.69 ticks)
Clique table members: 7656.
MIP emphasis: balance optimality and feasibility.
MIP search method: dynamic search.
Parallel mode: deterministic, using up to 60 threads.
Root relaxation solution time = 0.15 sec. (88.40 ticks)

Nodes Cuts/
Node Left Objective IInf Best Integer Best Bound ItCnt Gap

0 0 142.0000 34 142.0000 1263
* 0+ 0 156.0000 142.0000 1263 8.97%
0 0 142.0000 34 156.0000 Cuts: 4 1323 8.97%
0 0 142.0000 22 156.0000 Cuts: 4 1329 8.97%
0 0 142.0000 34 156.0000 Cuts: 6 1338 8.97%
0 2 142.0000 34 156.0000 142.0000 1338 8.97%
Elapsed time = 3.96 sec. (2311.50 ticks, tree = 0.01 MB, solutions = 1)
2 4 142.0000 10 156.0000 142.0000 3052 8.97%
9 5 142.0000 34 156.0000 142.0000 6082 8.97%
12 6 146.6667 11 156.0000 142.0000 10543 8.97%
15 5 146.6667 11 156.0000 142.0000 14124 8.97%
25 3 cutoff 156.0000 142.0000 17415 8.97%
28 6 146.6667 11 156.0000 142.0000 20969 8.97%
38 7 146.6667 11 156.0000 142.0000 23871 8.97%
42 7 146.6667 11 156.0000 142.0000 26442 8.97%
46 7 cutoff 156.0000 142.0000 31093 8.97%
63 8 142.0000 10 156.0000 142.0000 41689 8.97%
Elapsed time = 8.43 sec. (5846.02 ticks, tree = 0.14 MB, solutions = 1)
92 11 149.0000 9 156.0000 142.0000 54811 8.97%

Implied bound cuts applied: 6
Lift and project cuts applied: 1
Gomory fractional cuts applied: 3

Root node processing (before b&c):
Real time = 3.71 sec. (2273.88 ticks)
Parallel b&c, 60 threads:
Real time = 7.22 sec. (5247.98 ticks)
Sync time (average) = 5.34 sec.
Wait time (average) = 0.00 sec.
------------
Total (root+branch&cut) = 10.93 sec. (7521.86 ticks)

Solution pool: 1 solution saved.

MIP - Integer optimal solution: Objective = 1.5600000000e+02
Solution time = 10.95 sec. Iterations = 60734 Nodes = 113
Deterministic time = 7521.96 ticks (686.86 ticks/sec)

◯計算サーバ
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0



***** Gurobi Optimizer Ver.6.0の主な変更点は、以下となります。******

【パフォーマンスの改善】
・MIP:全体で17%の速度改善を実現。
(解くのに100秒以上かかる難しい問題では、27%の速度改善を実現。)
・LP:全体で6%の速度改善を実現。
    (すでに世界最高速として認知されていますが、著しい改善を実現。)
・MIQP:全体で18%の速度改善を実現。
・MIQCP:全体で28%の速度改善を実現。
*注意点:ただし、各モデルは独特なため、上記速度改善の実績より速い場合も、
遅い場合もあります。

【分散MIPソルバー】
MIPモデルを、異なるいくつかのマシン上でパラレルに解くことができるようになりま
した。単にどのマシンを使用したいかを明記したリストをGurobiに与えるだけで、利用
可能なマシンの中で、Gurobiが自動的に処理を分散します。この新しい分散MIPソルバ
ーは、既存の分散並行MIPソルバーと分散チューニング ツールを高速化します。

【区分線形目的関数のサポート】
V.6.0では、区分線形目的関数を、明示的に使えるようになりました。特に連続モデル
における凸区分線形目的関数は、シンプレックスアルゴリズムによって直接処理され、
この特徴により、大幅な速度改善が実現されます。

【その他】
・並行LPソルバー:既存の分散並行ソルバーを、LPモデルおよびMIPモデルの両方を
サポートするよう、機能拡張をしました。
・2000億の非ゼロのサポート:制約行列において2000億以上の非ゼロ値を持
つモデルを構築し、解けるようになりました。
・遅延制約の明示的なサポート:遅延制約属性を使うことで、制約式を遅延評価するこ
とができます。LPファイルとMPSファイルで制約式が
遅延評価されることを示すこともできます。
・その他:新しい非同期最適化手法、新しいスケーリングオプション等、多数の機能拡
張有り。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする