最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

The 2015 International Conference on High Performance Computing & Simulation (HPCS 2015)

2015年04月30日 00時49分37秒 | Weblog
以下の国際会議 HPCS2015 に Graph500 関連の論文が採択されました。

The 2015 International Conference on High Performance Computing & Simulation (HPCS 2015)

The Thirteen Annual Meeting

July 20 – 24, 2015
The Hilton Amsterdam Hotel
Amsterdam, the Netherlands
コメント
この記事をはてなブックマークに追加

総合研究棟(理学系) 4月下旬

2015年04月29日 01時01分17秒 | Weblog














コメント
この記事をはてなブックマークに追加

九大 IMI 共同利用研究:公開ワークショップ

2015年04月28日 19時32分29秒 | Weblog
九州大学マス・フォア・インダストリ研究所 短期共同研究 "大規模データに対する最大フロー求解アルゴリズムの実装技術の構築"に関する公開ワークショップを以下の日時と場所で開催致します。

研究計画題目:大規模データに対する最大フロー求解アルゴリズムの実装技術の構築
研究代表者:瀧澤重志(大阪市立大学・工学研究科・准教授)
研究実施期間:平成27年6月8日(月)~ 平成27年6月12日(金)

日程:2015年6月8日(月)~6月12日(金)
場所:九州大学 伊都キャンパス 数理学研究教育棟3F 中セミナー室7
http://www.kyushu-u.ac.jp/access/map/ito/ito.html (32 番の建物)
参加費:無料

10:00 ~ 10:40
講演題名:普遍的最速流アルゴリズム実装の詳細と課題
講演者と所属:小林和博(海上技術安全研究所)
アブストラクト:普遍的最速流を求める方法として,もとのネットワークに対応する時間拡大ネットワーク上で最大フローを繰り返し求める方法がある.発表者らこの方法を用いて,大規模なネットワーク上で普遍的最速流を求めるプログラムを開発した.現状では,市町村規模のネットワークに対して,日単位の計算時間がかかっており,多数のシナリオに対するシミュレーションのためにはより高速な計算を実現することが望ましい.本講演では,現在の実装の詳細と課題を述べる.

10:50 ~ 11:30
講演題名:普遍的最速流計算における最大流アルゴリズム
講演者と所属:安井雄一郎(九州大学共進化社会システム創成拠点)
アブストラクト:時間拡大ネットワークを用いた普遍的最速流アルゴリズムは、入力ネットワークに対する時間拡大と最大流計算を繰り返す手法である。発表者らの数値実験により道路ネットワークに対する普遍的最速流計算では実行時間の大部分を最大流計算が占めることが明らかとなった。一方で先行研究では最大流アルゴリズムの性能は扱うグラフの特性(平面性や疎密性など)に依存することが指摘されている。このように効率的な普遍的最速流計算のためには適切な最大流アルゴリズムを選択する必要がある。本講演では最大流アルゴリズムの選択に関して数値実験結果を用いて説明を行う。

11:30 ~ 13:00
昼食&休憩

13:00 ~ 13:40
講演題名:梅田地下街の浸水避難計画に対する数理技術を用いた支援
講演者と所属:瀧澤重志(大阪市立大学)
アブストラクト:大阪北区の梅田地下街は世界でも屈指の利用者数を誇る大規模な地下街であるが,その北側に位置する淀川からの津波等に伴う河川氾濫や内水氾濫のリスクにさらされている.本講演では,大阪市地下空間浸水対策協議会の活動の一環として行った当該地区のマルチエージェントによる避難シミュレーションと,基礎的な最速フローモデルの適用事例を紹介し,本地域の浸水避難計画への数理的な手法による支援の可能性について話題提供を行う.

13:50 ~ 14:30
講演題目:歩車混合避難計画問題
講演者と所属:神山直之(九州大学 / JSTさきがけ)
アブストラクト:本発表では,塙,加藤,瀧澤,東川によって提案された歩車混合避難計画問題の紹介,および発表者によって得られた理論的成果と今後の課題に関する発表を行う.

14:40 ~ 15:20
講演題名:津波避難計画の前提となる高精度津波シミュレーションと,被災後復旧段階における湛水域と道路網について
講演者と所属:佐藤憲一郎(海洋研究開発機構)
アブストラクト詳細な地形データを使用する事で,津波浸水域の道路一本一本まで判別できる精度となった.そこでこの高精度な津波浸水シミュレーションの結果を用いて浸水深区分図を作成し,道路の利用可否を推定する手法について説明する.また被災後復旧段階の道路網について,行政により優先的に啓開される道路は事前に決められており,道路啓開・湛水域排水作業に取りかかる順序は地区により異なる.段階的に縮小していく津波湛水域と,それにともない利用可能となる範囲が拡大していく道路網について,行政による復旧手順をふまえて検討する手法について提案する.

15:20 ~ 15:50
休憩

15:50 ~ 16:30
講演題名:Pythonによるグラフ・ネットワーク最適化
講演者と所属:斉藤努((株)構造計画研究所)
アブストラクト(数行から10行程度):データ分析、機械学習などでPythonが利用される機会が増えています。数理最適化においても、線形最適化問題、整数最適化問題、非線形最適化問題など、さまざまな問題を解くことが可能です。本講演では、グラフ・ネットワークにおける最適化問題についても簡単に
求解できることを紹介します。問題例としては、最短路、最大クリーク、
最大マッチング、最小木、最小費用流、最大流などを事例とともに説明します。

16:40 ~ 17:20
講演題名:グラフ解析と最適化技術で実現する都市OS
講演者と所属:藤澤克樹(九州大学 マス・フォア・インダストリ研究所 / JST CREST)
アブストラクト:都市での生活を快適あるいは安全なものにするために都市 OS(オペレーティングシステム)の開発が始まっています.都市OSでは大量のセンサーデータやオープンデータテなどを用いて都市における交通網の設計を行ったり,異常事態の発生時における避難誘導を行ったりするための機能を持つことが想定されています.都市OSにおける革新的な新基軸としては数学的な手法(数理最適化問題やグラフ解析さらにネットワークフローによる分析)と計算技術(計算量とデータ移動量の考慮と最適化による高速かつ省電力計算)にあります.本講演ではこれらの特徴を持った都市OSに関する解説を行います.

19:30 ~ 21:30
懇親会
コメント
この記事をはてなブックマークに追加

CREST・さきがけ平成27年度研究提案募集のご案内(第1期)締め切り迫る

2015年04月27日 01時05分11秒 | Weblog
昨年よりも早めの締め切りになっています。私が応募した 2011 年と同じくらいの締め切りの時期です。

CREST・さきがけ平成27年度研究提案募集のご案内(第1期)


第1期は、CRESTの9研究領域、さきがけの8研究領域(平成25、26年度発足の研究領域)ダウンロードにおいて募集を行います。
 平成27年度発足新規研究領域を対象とした第2期については、平成27年6月中旬の募集開始を予定しています。
募集締切:
  CREST/ 平成27年5月19日(火)正午
  さきがけ/ 平成27年5月12日(火)正午
書類選考結果の通知: 平成27年6月中旬~7月中旬
面接選考期間: 平成27年6月下旬~7月下旬
研究開始: 平成27年10月以降
コメント
この記事をはてなブックマークに追加

cuSolverSP: sparse LAPACK Function Reference

2015年04月26日 19時51分54秒 | Weblog
CUDA 7.0 に付属している cuSOLVER ライブラリには以下のように Dense (密)や Sparse (疎)な線形代数系の演算の関数が用意されている。

New cuSOLVER library of dense and sparse direct solvers
Significant acceleration for Computer Vision, CFD, Computational Chemistry, and Linear Optimization applications.
Key LAPACK dense solvers 3-6x faster than MKL.
Dense solvers include Cholesky, LU, SVD and QR
Sparse direct solvers 2-14x faster than CPU-only equivalents.
Sparse solvers include direct solvers and eigensolvers

スパース行列に対する Cholesky 分解の関数も用意されている。
cuSolverSP: sparse LAPACK Function Reference

This chapter describes the API of cuSolverSP, which provides a subset of LAPACK funtions for sparse matrices in CSR or CSC format.

6.2.3. cusolverSp<t>csrlsvchol()


コメント
この記事をはてなブックマークに追加

HP Moonshot 上での Linpack

2015年04月25日 03時39分28秒 | Weblog
以下の HP Moonshot において Linpack 測定を開始しました。

CPU Intel(R) Xeon(R) CPU E3-1284L v3 @ 1.80GHzは 16FLOPS/clock/core ですので、全体では 45カートリッジ x 4 コア x 2.6GHz(TurboBoost時) x 16FLOPS = 7488GFlops のピーク性能になります。
以下の場合では性能効率は 5251 / 7488 = 70.12%なので、まだまだ低い性能です。

================================================================================
HPLinpack 2.1 -- High-Performance Linpack benchmark -- October 26, 2012
Written by A. Petitet and R. Clint Whaley, Innovative Computing Laboratory, UTK
Modified by Piotr Luszczek, Innovative Computing Laboratory, UTK
Modified by Julien Langou, University of Colorado Denver
================================================================================

An explanation of the input/output parameters follows:
T/V : Wall time / encoded variant.
N : The order of the coefficient matrix A.
NB : The partitioning blocking factor.
P : The number of process rows.
Q : The number of process columns.
Time : Time in seconds to solve the linear system.
Gflops : Rate of execution for solving the linear system.

The following parameter values will be used:

N : 400000
NB : 128 256
PMAP : Row-major process mapping
P : 5 9
Q : 9 5
PFACT : Left Crout Right
NBMIN : 2 4
NDIV : 2
RFACT : Left Crout Right
BCAST : 1ring
DEPTH : 0
SWAP : Mix (threshold = 64)
L1 : transposed form
U : transposed form
EQUIL : yes
ALIGN : 8 double precision words

--------------------------------------------------------------------------------

- The matrix A is randomly generated for each test.
- The following scaled residual check will be computed:
||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
- The relative machine precision (eps) is taken to be 2.220446e-16
- Computational tests pass if scaled residuals are less than 16.0

================================================================================
T/V N NB P Q Time Gflops
--------------------------------------------------------------------------------
WR00L2L2 400000 128 5 9 8125.38 5.251e+03
HPL_pdgesv() start time Thu Apr 23 16:40:35 2015

HPL_pdgesv() end time Thu Apr 23 18:56:00 2015

--------------------------------------------------------------------------------
||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)= 0.0006944 ...... PASSED


HP ProLiant m710 サーバーカートリッジ

プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 8GB(1x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ 使用可能DIMMスロット数 SODIMMスロット x 4 最大構成 32GB(4 x 8GB)
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 120GB & 480GB





コメント
この記事をはてなブックマークに追加

共進化社会システムイノベーションセンター 2015年4月23日

2015年04月24日 03時37分25秒 | Weblog
共進化社会システムイノベーションセンターの現在(2015年4月23日)

2階ホール


2階休憩室
コメント
この記事をはてなブックマークに追加

九州大学共進化社会システム創成シンポジウム ~都市OSはこう創る!~開催について

2015年04月23日 00時35分58秒 | Weblog
以下のページから講演資料がダウンロードできるようになっています。
九州大学共進化社会システム創成シンポジウム ~都市OSはこう創る!~開催について

【プログラム】

<12:30>
-受付開始-

<13:00-13:30>
開会挨拶 「都市OSの創り方0 ビジョン、ミッション、そしてストラテジー」
村上 和彰(九州大学大学院システム情報科学研究院教授)

<13:30-14:00>
「都市OSの創り方1 P-Sen: 屋外人流センシング編」
内田 誠一(九州大学大学院システム情報科学研究院教授)

<14:00-14:30>
「都市OSの創り方2 B-Sen: ヒト・モノ・ロボットの屋内センシング編」
倉爪 亮(九州大学大学院システム情報科学研究院教授)

<14:30-15:00>
「都市OSの創り方3 BODIC.org: ビッグデータ&オープンデータ蓄積・分析・活用編」
後藤 孝行(九州大学共進化社会システム創成拠点学術研究員)

<15:00-15:30>
B-Sen内覧会&休憩

<15:30-16:00>
「都市OSの創り方4 人流・交通流ビッグデータを活用した次世代都市経営編編」(仮題)
森岡 道雄(株式会社日立製作所 情報・通信システム社 スマート情報システム統括本部 担当部長)

<16:00-16:30>
「都市OSの創り方5 ビッグデータ解析で福岡市の未来(5分後から数年後まで)を予測する!編」
藤澤 克樹(九州大学マス・フォア・インダストリ研究所教授)

<16:30-17:00>
「都市OSの創り方6 都市OS4E: エネルギー需給最適化編」
谷口 倫一郎(九州大学大学院システム情報科学研究院教授)

<17:00-17:30>
「都市OSの創り方7 総集編」 閉会挨拶
是久 洋一(九州大学共進化社会システム創成拠点長)

<17:30-18:00>
P-Sen被センシングツアー(交流会場へ移動)
ガイド:高野 茂(九州大学共進化社会システム創成拠点准教授)
コメント
この記事をはてなブックマークに追加

HP Moonshot 上での SDPARA

2015年04月22日 03時48分34秒 | Weblog
前回に続いて HP Moonshot 45カートリッジ (45 x 4 = 180コア)で SDPARA 7.4.0 の実験を行っています。Moonshot のネットワークは RoCE (RDMA over Converged Ethernet)に対応していますので、mvapich2 も使用可能です。

◯ソフトウェア SDPARA 7.4.0

◯ theta6.dat-s
mvapich2 2.1 : 6.27s
mpich 3.1.4 : 6.56s
OpenMPI 1.8.4 : 24.47s
OpenMPI 1.6.5:7.81s

◯ Be.1S.SV.pqgt1t2p.dat-s
mvapich2 2.1 : 255.58s
mpich 3.1.4 : 254.76s
OpenMPI 1.8.4 : 447.26s
OpenMPI 1.6.5:271.69s

◯ DSJC1000.9.col.dat-s
mvapich2 2.1 : 585.99s
mpich 3.1.4 : 747.27s
OpenMPI 1.8.4 : 1206.07s
OpenMPI 1.6.5:487.07s


HP ProLiant m710 サーバーカートリッジ

プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 8GB(1x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ 使用可能DIMMスロット数 SODIMMスロット x 4 最大構成 32GB(4 x 8GB)
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 120GB & 480GB





コメント
この記事をはてなブックマークに追加

IEEE Cluster 2015

2015年04月21日 21時36分38秒 | Weblog
IEEE Cluster 2015

Welcome to IEEE Cluster 2015. The conference takes place in Chicago, Illinois, the third largest city in the United States and a major technological and cultural capital. The conference is held on September 9-11 (Wednesday through Friday) with affiliated workshops and tutorials occurring on September 8 (Tuesday). Cluster 2015 welcomes research papers, workshops, and tutorials on advances in topics related to cluster computing.

Technical Program Committee に加わることになりました。。。
コメント
この記事をはてなブックマークに追加

HP Moonshot 納品その5

2015年04月20日 00時51分14秒 | Weblog
福岡市内の道路に関する(媒介)中心性計算を HP Moonshot 45 カートリッジを使用して計算してみました。OpenMPI 1.6.5 の方が mpich 3.1.4 よりも少し速いようです。

180コア使用時(45 ノード x 4コア):
1; mpich 3.1.4 : 150.554秒
2; openmpi 1.6.5 : 141.714秒



HP ProLiant m710 サーバーカートリッジ

プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 8GB(1x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ 使用可能DIMMスロット数 SODIMMスロット x 4 最大構成 32GB(4 x 8GB)
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 120GB & 480GB





コメント
この記事をはてなブックマークに追加

数学・数理科学の視点からのエンジン適合の研究

2015年04月19日 02時26分31秒 | Weblog
数学・数理科学の視点からのエンジン適合の研究

研究実施期間 平成27年6月17日(水)~ 平成27年6月18日(木)

研究分野のキーワード 統計分析, 最適化, 制御, スパース推定, 動的モデリング, 境界モデリング, パラメータ探索

目的と期待される成果  自動車エンジン開発に対してユーザーから安全性や経済性だけでなく, 環境負荷低減など社会的に強い要求もある. そういった要求に基づく自動車エンジンを開発するためにエンジン適合と呼ばれる適合試験が必要になる. 適合試験で要求を満たすようにエンジンの開発が進められるが, 要求が多くなればなるほど, 開発システムや工程が複雑になる. 一方で, 開発期間および開発コストの削減も要求されることもあり, 短期間・低コストの自動車エンジン開発が強く望まれている. そのため, エンジン適合を効率良く実施する必要があり, 近年では, Model Based Calibration (MBC)と呼ばれる開発手法が広く用いられている.
 MBCは実験計画や応答曲面の作成, 実車評価など幾つかの工程から構成されており, 各工程でエンジン制御システムに関連する対象物を数理モデル化し, 統計・最適化・制御手法を適用して様々な要求を満たす自動車エンジンを開発する手法である. 現状ではエンジンが様々な物理現象を含んだ非線形な動的システムであるため, 各プロセスの数理モデルがエンジンを正確にモデル化できておらず, 手法を適用した結果が必ずしもエンジンに有用でないことがある. また, エンジン開発者自身の技能・能力に頼っており, 開発期間や開発コストの削減につながっていないのが現状である.
 本提案では, MBCの「境界モデリング」, 「実験計画」などMBCにおける複数の工程に焦点を当て, それらの工程における現状と問題点を共有し, 数学・数理科学的アプローチで貢献できないか議論する. ここで用いられる数学・数理科学的アプローチは, 統計・最適化・制御だけでなく, 幾何学的視点による可視化なども想定している. 特に, 「境界モデリング」に焦点を当て, 前年度の検討で得られた知見の具体化だけでなく動的特性を考慮した境界モデリングやモデルリダクション・スパース推定などの適用にも範囲を広げる. より現実的な境界モデリングを議論し参加している自動車各社に自動車エンジン開発に有用な指針や示唆が与えられるよう慎重に議論・検討する予定である.

組織委員(研究集会)
参加者(短期共同利用) 佐藤正浩((株)本田技術研究所・主任研究員)
下城孝名子((株)本田技術研究所・研究員)
大畠明(トヨタ自動車・理事)
渡邊智(トヨタ自動車株式会社 エンジン先行制御システム開発部・主幹)
龍田浩(日産自動車株式会社 第一パワートレイン開発本部・主管)
原田真悟(マツダ株式会社 エンジン性能開発部・研究員)
藤澤克樹(九州大学マス・フォア・インダストリ研究所・教授)
岩瀬将美(東京電機大学 未来科学部・准教授)
脇隼人(九州大学マス・フォア・インダストリ研究所・准教授)
コメント
この記事をはてなブックマークに追加

mpich 3.1.4 と OpenMPI 1.8.4 その2

2015年04月18日 01時05分58秒 | Weblog
前回に続いて HP Moonshot 45カートリッジ (45 x 4 = 180コア)で SDPARA 7.4.0 の実験を行っています。OpenMPI 1.8.4 が遅かったので、OpenMPI 1.6.5 を利用してみました。

◯ソフトウェア SDPARA 7.4.0

◯ theta6.dat-s
mpich 3.1.4 : 6.56s
OpenMPI 1.8.4 : 24.47s
OpenMPI 1.6.5:7.81s

◯ Be.1S.SV.pqgt1t2p.dat-s
mpich 3.1.4 : 254.76s
OpenMPI 1.8.4 : 447.26s
OpenMPI 1.6.5:271.69s

◯ DSJC1000.9.col.dat-s
mpich 3.1.4 : 747.27s
OpenMPI 1.8.4 : 1206.07s
OpenMPI 1.6.5:487.07s

◯ tai18a.dat-s
mpich 3.1.4 : 1032.49s
OpenMPI 1.8.4 : 1700.95s
OpenMPI 1.6.5: 650.44s


HP ProLiant m710 サーバーカートリッジ

プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 8GB(1x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ 使用可能DIMMスロット数 SODIMMスロット x 4 最大構成 32GB(4 x 8GB)
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 120GB & 480GB





コメント
この記事をはてなブックマークに追加

九州大学共進化社会システム創成拠点の Twitter アカウント

2015年04月17日 00時01分16秒 | Weblog
出来たみたいです。

九州大学共進化社会システム創成拠点
@CESS_323


Fukuoka, Kyushu University
coi.kyushu-u.ac.jp

コメント
この記事をはてなブックマークに追加

最適化の基盤とフロンティア ─ 未来を担う若手研究者の集い2015 ─

2015年04月16日 00時26分53秒 | Weblog
最適化の基盤とフロンティア ─ 未来を担う若手研究者の集い2015 ─

日時:2015年5月30日 (土),31日 (日)
会場:筑波大学 筑波キャンパス 春日地区 春日講堂
参加費:無料 (ただし,宿泊,懇親会への参加は有料)
事前登録:不要
コメント
この記事をはてなブックマークに追加