最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

自己紹介と重要リンク

2017年10月19日 22時11分55秒 | Weblog
大規模最適化問題に対する超高速&安定計算。
半正定値計画問題(SDP)の対するソフトウェア SDPA, SDPARA の開発者及び SDP の超大規模計算に対する世界記録保持者。
JST CREST ポストペタスケールシステムにおける超大規模グラフ最適化基盤:研究代表者

1: GraphCrest ホームページ
2: SDPA ホームページ(sourceforge)
3: Katsuki Fujisawa HP
4: 最短路問題 Online Solver
5: SCOPE(「計算と最適化の新展開」研究部会)(すでに終了)
6: Twitter : sdpaninf

コメント
この記事をはてなブックマークに追加

JST CREST : ポストペタスケールシステムにおける超大規模グラフ最適化基盤

2017年08月27日 23時53分47秒 | Weblog
JST CREST (Core Research for Evolutional Science & Technology)
応募研究領域 : ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出
研究課題名 : ポストペタスケールシステムにおける超大規模グラフ最適化基盤

◯研究課題要旨
 大規模災害等は突発的に発生するため事前予測による防災計画だけでなく、動的なデータ収集等とスパコン上での高速計算によって速やかに避難、誘導計画を策定する必要がある。すでに研究代表者らのグループでは首都圏道路網や鉄道網を精密なグラフデータに変換して、超大規模なグラフ処理を用いた避難、誘導計画の策定を進めているが、非常に計算量やデータ量などの規模が大きく従来の手法では処理が困難である。ポストペタスケールスーパーコンピュータ(スパコン)における最重要カーネルのひとつでもある超大規模グラフ処理を実現するためには、理論的性能限界等からボトルネック箇所を特定、数値演算能力とメモリバンド等のトレードオフ関係を把握、計算量とデータ移動量の正確な推定、疎性やサイズなどのデータ特性と性能値の見極め、などが必要とされる。しかし、従来手法では、数千万規模の並列性を備え、ストレージの階層性が深化したポストペタスケールシステム上でのスケーラブルな実行は困難であり、アルゴリズム、システムソフトウェアと同時並行的な解決が求められている。我々は、これらの問題に対応した超大規模グラフ最適化システムを提案する。本システムは、大規模グラフデータに対するリアルタイムストリーミング処理、計算量とデータ移動量を考慮したグラフ最適化アルゴリズム、ストレージの階層性を考慮した大規模グラフデータストア、超大規模グラフのリアルタイム可視化など従来のスパコンでは実現されてこなかった新しい問題を解決する。これらのシステムは TSUBAME2.0のようなペタスケールスパコン上で構築と評価を行い、今後、出現が想定されるポストペタスケールスパコンのアーキテクチャ上での実行に適したソフトウェア基盤を構築し、エクサスケールスーパーコンピューティングへの方向性づくりに大いに貢献する。



◯研究組織
◇研究代表者
藤澤克樹(九州大学)
◇研究グループ
1: 超大規模データを伴う最適化問題に対する高速計算システムの構築と評価 (グループリーダ : 藤澤克樹 (九州大学))
ー グラフ探索(最短路、幅優先探索、重要性計算)、数理計画問題(半正定値計画問題:SDP, 混合整数計画問題 MIP or MINLP 等)

2: リアルタイム大規模グラフストリーム処理系及びグラフ最適化ライブラリの開発 (グループリーダ : 鈴村豊太郎 (バルセロナスーパーコンピュータセンター))

3: 大規模グラフ処理向けオンデマンド階層型データストアの開発 (グループリーダ : 佐藤仁 (東京工業大学))
コメント
この記事をはてなブックマークに追加

最大フロー求解アルゴリズムの効率的実装と,その大規模データを用いた避難計画策定への応用

2016年08月31日 18時35分57秒 | Weblog
最大フロー求解アルゴリズムの効率的実装と,その大規模データを用いた避難計画策定への応用
An efficient implementation of the max-flow algorithm and its application to the evacuation planning using large-scale data


開催日
2016年9月22日(木) 9:50 - 15:30

開催場所
九州大学 伊都キャンパス ウエスト1号館 D棟 4階 IMIコンファレンスルーム(W1-D-414)


【プログラム】
(全7講演)
9月22日(木)

09:50 - 10:00 オープニング

10:00 - 10:30 講演1
講演者:小林 和博 (東京理科大学)
講演タイトル《避難計画問題に対する計算技術とその応用》
≪Computation and application of the evaculation problem≫
アブストラクト: 大規模データに対するグラフ解析の実現では,モデル・アルゴリズム・計算技術の成果の効果的な組合せが重要である.昨年度の短期共同研究では,最大フロー計算の効率的な実装方法と,その津波避難計画への応用を検討した.本発表では,具体的な都市構造や地形の考慮,大規模実データへの対応,アルゴリズムの改善など,昨年度の成果を基として,本年度の研究の目的と期待される成果を述べる.

10:30 - 11:00 講演2
講演者:藤澤 克樹 (九州大学・JST CREST)
講演タイトル《大規模グラフ解析と都市 OS の開発--- ヒト・モノのモビリティに関する新しい数理モデルとその応用 ---》
≪Large-scale graph analysis for realizing urban OS≫
アブストラクト: 新しいスーパーコンピュータの応用として大規模なグラフ解析が注目を集めている. 現在、都市 OS 開発などのサイバーフィジカルシステムにおいて, ヒト・モノのモビリティに関する数理モデル及び最適化手法としてのグラフ解析の利用が開始されている. このような最先端理論(Algorithm Theory)+ 大規模実データ(Big Data)+ 最新計算技術(Computation)の有機的な組合せによる最新のグラフ解析の応用について紹介を行う.

11:00 - 11:30 講演3
講演者:斉藤 努 (構造計画研究所)
講演タイトル《Pythonによる最適化とデータ分析》
≪Optimization and data analysis using Python≫
アブストラクト: Pythonでよく用いられるライブラリを紹介する.その中で, 最適化とデータ分析について, 詳しく見ていくことにする.データ分析でよく用いられるデータ構造を使うと, 最適化の数理モデルをわかりやすく表現することができる. いくつかの例題を通して, この手法を具体的に説明する.

11:30 - 13:00 休憩

13:00 - 13:30 講演4
講演者:間瀬 正啓, 清水 正明 (日立製作所)
講演タイトル《ヒト・モノの動きの数理および機械学習によるモデル化》
≪Mathematical modeling and machine learning for flow of human and vehicle.≫
アブストラクト: 都市の交通・物流の安全性と利便性の向上に向けて, ヒト・モノの動きのデータの活用が進んでいる. 本発表では, その一例として動線データを分析, 活用するための数理および機械学習におけるモデル化の取り組みについて紹介する.

13:30 - 14:00 講演5
講演者:神山 直之 (九州大学)
講演タイトル《避難計画問題に対する実用的なアルゴリズム》
≪Practical algorithms for the evacuation problem≫
アブストラクト: 本発表では,動的ネットワーク上で定義される避難計画問題に対する実用的なアルゴリズムに関する発表を行う.まずこの問題が理論的に劣モジュラ関数最小化問題を1回解く計算時間で解けることを示し,この考え方を用いて時間拡大ネットワーク上での最大流問題を解く回数を減らすことができると期待されるアルゴリズムを提案する.その後,計算実験結果を通じ提案アルゴリズムの性能および振る舞いを報告する.

14:00 - 14:30 講演6
講演者:瀧澤 重志 (大阪市立大学)
講演タイトル《大阪市を対象とした避難計画問題の進展》
≪Recent progress in evacuation problem in the city of Osaka≫
アブストラクト: 昨年度の公開WSでは,大阪市地下空間浸水対策協議会の活動の一環として行った,梅田地下街のマルチエージェントによる避難シミュレーションと,基礎的な最速フローモデルの適用事例を紹介した.今年度は,その後の研究の展開や,今年度開始した大阪市全域を対象とした南海トラフ地震発生時の,避難・帰宅行動に関する研究の進捗について説明する.

14:30 - 15:00 講演7
講演者:佐藤 憲一郎 (関東学院大学)
講演タイトル《普遍的最速フローを用いた地震津波シナリオの評価》
≪Evaluation of the Tsunami inundation modeling using the universally quickest flow≫
アブストラクト: 現在,津波避難に関する見直しが進められているが,特定の地震津波シナリオへの対策にとどまっているケースが散見される.しかし,想定される地震津波シナリオは多数存在し,その中には現在想定しているシナリオを超える避難が困難なシナリオも存在しうる.そこで,想定される多数の地震津波シナリオに対し,避難完了までの最短時間を定量的に示すことができる普遍的最速フローと,津波浸水時の道路浸水状況・浸水開始時刻が判別できる高精度な津波浸水シミュレーションを組み合わせ,地震津波シナリオ毎に津波浸水域避難シミュレーションを実施する手法について提案する.

15:00 - 15:30 ディスカッション
コメント
この記事をはてなブックマークに追加

IMI プレプリント

2016年08月30日 00時07分51秒 | Weblog
2016-11 Title:An indirect search algorithm for disaster restoration with precedence and synchronization constraints

Author : Akifumi Kira, Hidenao Iwane, Hirokazu Anai, Yutaka Kimura & Katsuki Fujisawa

Abstract: When a massive disaster occurs, to repair the damaged part of lifeline networks, planning is needed to appropriately allocate tasks to two or more restoration teams and optimize their traveling routes. However, precedence and synchronization constraints make restoration teams interdependent of one another, and impede a successful solution by standard local search. In this paper, we propose an indirect local search method using the product set of team-wise permutations as an auxiliary search space. It is shown that our method successfully avoids the interdependence problem induced by the precedence and synchronization constraints, and that it has the big advantage of non-deteriorating perturbations being available for iterated local search.
コメント
この記事をはてなブックマークに追加

最適化関連:公募3件

2016年08月29日 02時49分41秒 | Weblog
【教員公募】九州大学 マス・フォア・インダストリ研究所 教授1名公募 (2016年11月30日必着)
http://www.imi.kyushu-u.ac.jp/files/recruit/file/bcb034353ef08eeec015ffe87f159b30.pdf

【教員公募】群馬大学社会情報学部 (数理モデリング分野) 2016年08月31日 消印有効
https://jrecin.jst.go.jp/seek/SeekJorDetail?fn=1&id=D116070313&ln_jor=0

【教員公募】九州大学大学院システム情報科学研究院 准教授 (1名) 情報学分野 平成28年8月末日 (必着)
http://kobo.jimu.kyushu-u.ac.jp/pdf/20160601145351.pdf
コメント
この記事をはてなブックマークに追加

産業における応用数理

2016年08月28日 00時05分01秒 | Weblog
日本応用数理学会 2016年度年会プログラム

▷ [研究部会OS] 産業における応用数理 [9月12日:16:30-17:50:1A]
大規模グラフ解析と都市 OS の開発 —ヒト・モノのモビリティに関する新しい数理モデルとその応用— / ○藤澤 克樹 (九州大学) [概要]
◎劣加法性に基づく提携構造形成問題とその応用 / 神山 直之 (九州大学, JSTさきがけ), ○吉良 知文 (九州大学), 穴井 宏和 ((株)富士通研究所), 岩根 秀直 ((株)富士通研究所), 大堀 耕太郎 ((株)富士通研究所) [概要]
剛体・油圧連成解析を用いた電動機HILSシステムの開発 / ○今西 悦二郎 (神戸製鋼) [概要]
複素モーメント型並列固有値解法の耐障害性とその性能評価 / ○今倉 暁 (筑波大学), 二村 保徳 (筑波大学), 櫻井 鉄也 (筑波大学) [概要]

2016-09-12 ~ 09-14
日本応用数理学会 2016年度年会

会場: 北九州国際会議場 (福岡県北九州市小倉)
概要: 日本応用数理学会の 2016年度年会です. 応用数理的な研究, 産業, 教育等に関わる成果を発表し,御互いの知見を交換しあう場です. 奮って御参加ください.

詳細 web

http://annual2016.jsiam.org/

* 上記が正式な web で、下記は抜粋情報です.
開催日程 2016年 9月12日(月) ~ 14日(水)
会場 北九州国際会議場
(北九州市小倉北区浅野三丁目8-1), アクセス,周辺マップ等)
コメント
この記事をはてなブックマークに追加

公開ワークショップ

2016年08月27日 00時20分03秒 | Weblog
9月22日は祝日ですが、以下のワークショップを開催します。。。

2016年度短期共同研究「最大フロ-求解アルゴリズムの効率的実装と,その大規模データを用いた避難計画策定への応用」公開ワークショップ
開催日: 2016年9月22日(木・祝)
開催場所: 九州大学伊都キャンパス ウエスト1号館4F IMIコンファレンスルーム   
コメント
この記事をはてなブックマークに追加

自律成長するAIを用いて移住満足度向上を目指す実証実験を開始

2016年08月26日 00時38分05秒 | Weblog
プレスリリース:
自律成長するAIを用いて移住満足度向上を目指す実証実験を開始
~AIの社会受容性を考慮して移住希望者と移住候補地の適切なマッチングを実現~

【概要】:
国立大学法人九州大学(以下、九州大学)マス・フォア・インダストリ研究所富士通ソーシャル数理共同研究部門と福岡県糸島市(以下、糸島市)、株式会社富士通研究所(以下、富士通研究所)は、人間の好みを徐々に学習し、自ら成長するAI(人工知能)を用いて、地方都市への移住希望者と移住候補地を適切にマッチングさせるための共同実証実験を開始しました。
糸島市では、昨今の地方への移住・定住に関する注目度の高まりにより移住相談が増加しています。しかし、移住希望者は移住先検討の際、地域に密着した情報を得ることが難しく、移住者の満足度が低下することもありました。
今回、移住希望者の好みを自律成長するAIに学習させ、好みに基づいて移住希望者に適切と考える移住候補地の地域密着情報(注4)を提示し、提示された地域の評価を繰り返してもらうことで、移住希望者と移住候補地のマッチングを支援する実証実験を開始します。本実験を通じて、社会受容性を加味したAI技術の開発を行い、今後の移住希望者にとって満足度の高い移住地マッチングを行う仕組みの構築を目指します。
コメント
この記事をはてなブックマークに追加

日本応用数理学会 2016年度年会

2016年08月25日 01時08分49秒 | Weblog
2016-09-12 ~ 09-14
日本応用数理学会 2016年度年会

会場: 北九州国際会議場 (福岡県北九州市小倉)
概要: 日本応用数理学会の 2016年度年会です. 応用数理的な研究, 産業, 教育等に関わる成果を発表し,御互いの知見を交換しあう場です. 奮って御参加ください.

詳細 web

http://annual201h.jsiam.org/

* 上記が正式な web で、下記は抜粋情報です.
開催日程 2016年 9月12日(月) ~ 14日(水)
会場 北九州国際会議場
(北九州市小倉北区浅野三丁目8-1), アクセス,周辺マップ等)
コメント
この記事をはてなブックマークに追加

マス・フォア・インダストリ研究所 教授1名公募

2016年08月24日 02時38分30秒 | Weblog
マス・フォア・インダストリ研究所 教授1名公募(2016年11月30日必着)(応募書類は日本語でも可)

Call for Applicants

Position open for Professor
Institution: Kyushu University
Department: Institute of Mathematics for Industry
Employer Type: Academic
Position Type: Permanent
Subject Area(s): Mathematical Aspects of Information Sciences Geographic Location: Kyushu University Ito Campus, Fukuoka, Japan

Position Description
The Institute of Mathematics for Industry at Kyushu University (Fukuoka, JAPAN) invites applicants for a PROFESSOR POSITION ("Kyoju" in Japanese) starting from April 2017.
We seek candidates with a strong background in mathematic, interest in collaboration with industry and research expertise in mathematical aspects of information sciences including information processing, artificial intelligence, machine learning, cryptography, logic of programming languages, computer algebra and computational aspects of optimization and control theory. The selection will be based on the achievement and capability of candidates in mathematical research.
Kyushu University is one of the seven major national universities in Japan, located at Fukuoka in the western part of Japan. The Institute of Mathematics for Industry (IMI) was established in April 2011 and was declared a Joint Usage / Research Center for Mathematics for Industry in Japan in April 2013. Joint research is one of the most important research activities for IMI and is being promoted through close coordination with other research activities in IMI. IMI consists of approximately 28 full-time members who are active in various areas of pure and applied mathematics as well as in collaboration with industry. Please visit our website for more information. http://www.imi.kyushu-u.ac.jp/eng/

Salary
Salary will be determined based on qualification and experience in accordance with the wage system of Kyushu University.

Term
The term of contract is up to the mandatory retirement age of 65.

Duty
All professors in IMI are professors of Graduate School of Mathematics (“Suuri Gakufu” in Japanese) as well. So they have a responsibility for the education of graduate and undergraduate students. Also all professors in Mathematics (IMI and the Faculty of Mathematics) share administration duties, such as assistance for the entrance examinations and committee activities for the Institute, the Graduate School, and the University.
To apply, please send the documents listed below to the following address by POSTAL MAIL. (We do not accept applications by email or fax.) The documents must reach the address no later than 30th (Wed.) November 2016.

Inquiries are to be sent to Prof. Yoshihiro Mizoguchi
ym @ imi.kyushu-u.ac.jp
List of documents to be sent
1. Curriculum vitae.
2. List of publications and preprints, and list of talks.
3. Photocopies of selected (at most five) publications, and if necessary, other documents
such as research reports.
4. Summary of research achievements.
5. Description of future research projects. Description of ideas for education.
6. List of names and addresses of three references.
7. A letter of recommendation from one of the references. The reference may send this
directly to the address below.

Address
IMI Kyoju Hiring Committee,
Institute of Mathematics for Industry,
Kyushu University,
744 Motooka, Nishi-ku, Fukuoka,
819-0395, Japan

Remarks
1. Application documents may be written in English or in Japanese.
2. Personal information in the received documents is used only for the selection purpose. 3. We will not return the received documents unless requested by the applicant.
コメント
この記事をはてなブックマークに追加

JST フェア 2016

2016年08月23日 19時59分09秒 | Weblog
場所は端っこでした。。。

共進化社会システム創成拠点 / 九州大学

出展概要
当拠点は共進化社会システムを創成することを目標にヒト/モノ・エネルギー・情報のモビリティを実現する基盤的な技術確立と、マス・フォア・インダストリ(産業数学)のアプローチに基づく新しいイノベーション手法を活用した基盤システムの構築を推進しています。今回の展示会においてフェーズ1の取り組み内容と今後の計画、およびフェーズ1の成果のとして試作サンプルの展示、デモの実演を行います。

JST支援プログラム名称・期間
研究成果展開事業センター・オブ・イノベーション(COI)プログラム
H25~H33
コメント
この記事をはてなブックマークに追加

ICCOPT 2016 での講演 (Semi plenary talk) その4

2016年08月22日 19時55分07秒 | Weblog
QAPLIB tai40b に関する実験結果を掲載します。実行環境は以下の九大スパコン CX400 です。
Cholesky 分解の性能ですが、以下のように NVIDIA GPU K20 128枚で 100TFlops ぐらいです。

gpu.tai40b_ZKRW_R3_e0:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6108.246sec --> 98703.346GFlops ###
gpu.tai40b_ZKRW_R3_e0:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6035.300sec --> 99896.336GFlops ###
gpu.tai40b_ZKRW_R3_e0:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6034.922sec --> 99902.586GFlops ###
gpu.tai40b_ZKRW_R3_e0:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6035.628sec --> 99890.905GFlops ###
gpu.tai40b_ZKRW_R3_e0:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6016.467sec --> 100209.032GFlops ###
gpu.tai40b_ZKRW_R3_e0:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6014.609sec --> 100239.991GFlops ###
gpu.tai40b_ZKRW_R3_e0.1:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6067.971sec --> 99358.476GFlops ###
gpu.tai40b_ZKRW_R3_e0.1:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6007.004sec --> 100366.892GFlops ###
gpu.tai40b_ZKRW_R3_e0.1:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6002.535sec --> 100441.628GFlops ###
gpu.tai40b_ZKRW_R3_e0.1:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6004.056sec --> 100416.174GFlops ###
gpu.tai40b_ZKRW_R3_e0.1:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6004.984sec --> 100400.654GFlops ###
gpu.tai40b_ZKRW_R3_e0.1:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6001.672sec --> 100456.069GFlops ###
gpu.tai40b_ZKRW_R3_e0.10:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6084.231sec --> 99092.939GFlops ###
gpu.tai40b_ZKRW_R3_e0.10:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6000.982sec --> 100467.622GFlops ###
gpu.tai40b_ZKRW_R3_e0.10:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6001.369sec --> 100461.132GFlops ###
gpu.tai40b_ZKRW_R3_e0.10:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5998.202sec --> 100514.176GFlops ###
gpu.tai40b_ZKRW_R3_e0.10:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5997.180sec --> 100531.301GFlops ###
gpu.tai40b_ZKRW_R3_e0.10:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5996.803sec --> 100537.625GFlops ###
gpu.tai40b_ZKRW_R3_e0.11:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6080.609sec --> 99151.966GFlops ###
gpu.tai40b_ZKRW_R3_e0.11:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6011.266sec --> 100295.732GFlops ###
gpu.tai40b_ZKRW_R3_e0.11:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6010.154sec --> 100314.289GFlops ###
gpu.tai40b_ZKRW_R3_e0.11:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6009.950sec --> 100317.705GFlops ###
gpu.tai40b_ZKRW_R3_e0.11:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6009.056sec --> 100332.628GFlops ###
gpu.tai40b_ZKRW_R3_e0.11:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6007.208sec --> 100363.487GFlops ###
gpu.tai40b_ZKRW_R3_e0.12:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6082.307sec --> 99124.296GFlops ###
gpu.tai40b_ZKRW_R3_e0.12:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6005.487sec --> 100392.245GFlops ###
gpu.tai40b_ZKRW_R3_e0.2:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6073.922sec --> 99261.130GFlops ###
gpu.tai40b_ZKRW_R3_e0.2:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.609sec --> 100591.208GFlops ###
gpu.tai40b_ZKRW_R3_e0.2:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5992.482sec --> 100610.116GFlops ###
gpu.tai40b_ZKRW_R3_e0.2:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.416sec --> 100594.440GFlops ###
gpu.tai40b_ZKRW_R3_e0.2:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.983sec --> 100584.928GFlops ###
gpu.tai40b_ZKRW_R3_e0.2:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5995.609sec --> 100557.656GFlops ###
gpu.tai40b_ZKRW_R3_e0.3:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6088.760sec --> 99019.240GFlops ###
gpu.tai40b_ZKRW_R3_e0.3:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.546sec --> 100592.266GFlops ###
gpu.tai40b_ZKRW_R3_e0.3:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5992.918sec --> 100602.810GFlops ###
gpu.tai40b_ZKRW_R3_e0.3:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5997.957sec --> 100518.291GFlops ###
gpu.tai40b_ZKRW_R3_e0.3:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5989.645sec --> 100657.781GFlops ###
gpu.tai40b_ZKRW_R3_e0.3:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.478sec --> 100593.405GFlops ###
gpu.tai40b_ZKRW_R3_e0.4:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6089.100sec --> 99013.698GFlops ###
gpu.tai40b_ZKRW_R3_e0.4:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5991.683sec --> 100623.538GFlops ###
gpu.tai40b_ZKRW_R3_e0.4:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5991.717sec --> 100622.962GFlops ###
gpu.tai40b_ZKRW_R3_e0.4:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5985.861sec --> 100721.400GFlops ###
gpu.tai40b_ZKRW_R3_e0.4:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5982.920sec --> 100770.915GFlops ###
gpu.tai40b_ZKRW_R3_e0.4:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5984.565sec --> 100743.222GFlops ###
gpu.tai40b_ZKRW_R3_e0.5:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6081.938sec --> 99130.294GFlops ###
gpu.tai40b_ZKRW_R3_e0.5:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6004.970sec --> 100400.885GFlops ###
gpu.tai40b_ZKRW_R3_e0.5:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6006.461sec --> 100375.967GFlops ###
gpu.tai40b_ZKRW_R3_e0.5:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6005.662sec --> 100389.319GFlops ###
gpu.tai40b_ZKRW_R3_e0.5:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6011.675sec --> 100288.913GFlops ###
gpu.tai40b_ZKRW_R3_e0.5:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6006.091sec --> 100382.152GFlops ###
gpu.tai40b_ZKRW_R3_e0.6:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6093.153sec --> 98947.846GFlops ###
gpu.tai40b_ZKRW_R3_e0.6:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6003.723sec --> 100421.739GFlops ###
gpu.tai40b_ZKRW_R3_e0.6:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5999.893sec --> 100485.850GFlops ###
gpu.tai40b_ZKRW_R3_e0.6:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5998.815sec --> 100503.906GFlops ###
gpu.tai40b_ZKRW_R3_e0.6:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5983.322sec --> 100764.155GFlops ###
gpu.tai40b_ZKRW_R3_e0.6:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5991.518sec --> 100626.312GFlops ###
gpu.tai40b_ZKRW_R3_e0.7:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6075.362sec --> 99237.608GFlops ###
gpu.tai40b_ZKRW_R3_e0.7:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5998.667sec --> 100506.386GFlops ###
gpu.tai40b_ZKRW_R3_e0.7:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.682sec --> 100589.982GFlops ###
gpu.tai40b_ZKRW_R3_e0.7:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.228sec --> 100597.604GFlops ###
gpu.tai40b_ZKRW_R3_e0.7:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5994.083sec --> 100583.250GFlops ###
gpu.tai40b_ZKRW_R3_e0.7:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 5993.857sec --> 100587.047GFlops ###
gpu.tai40b_ZKRW_R3_e0.8:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6096.865sec --> 98887.596GFlops ###
gpu.tai40b_ZKRW_R3_e0.8:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6017.823sec --> 100186.454GFlops ###
gpu.tai40b_ZKRW_R3_e0.8:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6013.860sec --> 100252.472GFlops ###
gpu.tai40b_ZKRW_R3_e0.8:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6008.871sec --> 100335.704GFlops ###
gpu.tai40b_ZKRW_R3_e0.8:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6007.036sec --> 100366.367GFlops ###
gpu.tai40b_ZKRW_R3_e0.8:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6007.593sec --> 100357.061GFlops ###
gpu.tai40b_ZKRW_R3_e0.9:[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6095.993sec --> 98901.745GFlops ###

高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)


コメント
この記事をはてなブックマークに追加

HPGDMP 2016

2016年08月21日 01時26分53秒 | Weblog
HPGDMP 2016

Latest News

The submission deadline has been extended to 22nd August, 2016, AoE.
Submissions are accepted via EasyChair submission site.
About "HPGDMP16: High Performance Graph Data Management and Processing Workshop"

The High Performance Graph Data Management and Processing (HPGDMP) workshop will be held on November 13th 2016, at Salt Lake City, USA. The workshop will be co-located with the International Conference for High Performance Computing, Networking, Storage and Analysis conference (SC16), and it is organized in cooperation with the SIGHPC group. The HPGDMP is a half-day workshop and the program will include keynotes and paper presentations. Proceedings will be published through SIGHPC.

Important Dates
Paper Submission: August 8th
Extended Submission : August 22nd
Paper Notifications: September 28th
Camera-ready Submission: October 10th
Workshop Date: November 13th
コメント
この記事をはてなブックマークに追加

caffe と機械学習

2016年08月20日 00時32分27秒 | Weblog
GPU 4個用いて caffe による機械学習の実行中です。

$ nvidia-smi
Fri Aug 19 22:31:58 2016
+------------------------------------------------------+
| NVIDIA-SMI 352.39 Driver Version: 352.39 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla K40m Off | 0000:42:00.0 Off | 0 |
| N/A 54C P0 128W / 235W | 4218MiB / 11519MiB | 99% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K40m Off | 0000:43:00.0 Off | 0 |
| N/A 54C P0 132W / 235W | 4219MiB / 11519MiB | 99% Default |
+-------------------------------+----------------------+----------------------+
| 2 Tesla K40m Off | 0000:81:00.0 Off | 0 |
| N/A 52C P0 134W / 235W | 4220MiB / 11519MiB | 99% Default |
+-------------------------------+----------------------+----------------------+
| 3 Tesla K40m Off | 0000:82:00.0 Off | 0 |
| N/A 55C P0 130W / 235W | 4219MiB / 11519MiB | 99% Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 0 47292 C ...tmp/akirat/caffe.new2_5/build/tools/caffe 4192MiB |
| 1 51513 C ...tmp/akirat/caffe.new2_5/build/tools/caffe 4193MiB |
| 2 5111 C ...tmp/akirat/caffe.new2_5/build/tools/caffe 4193MiB |
| 3 56217 C ...tmp/akirat/caffe.new2_5/build/tools/caffe 4192MiB |
+-----------------------------------------------------------------------------+

◯計算サーバ
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 @ 2.80GHz x 4 socket
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
GPU : NVIDIA Tesla K40m x 4
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
CUDA : 7.5
OS : CentOS 7.2
コメント
この記事をはてなブックマークに追加

ICCOPT 2016 Best Paper Prize Finalists and Presentation

2016年08月19日 00時45分18秒 | Weblog
ICCOPT 2016 Best Paper Prize Finalists and Presentation

The selection committee invited the following contestants to present their work in a dedicated session, which takes place at Soukairou Hall, GRIPS, on Mon (Aug 8) 16:15-17:30.

Peyman Mohajerin Esfahani (EPFL & ETH Zurich)
Data-driven Distributionally Robust Optimization Using the Wasserstein Metric: Performance Guarantees and Tractable Reformulations

Mingyi Hong (Iowa State University)
Convergence Analysis of Alternating Direction Method of Multipliers for a Family of Nonconvex Problems

Mengdi Wang (Princeton University)
Stochastic Composition Optimization: Algorithms and Sample Complexities

The winner will be announced before the plenary talk in the Tuesday (Aug 9) morning.
コメント
この記事をはてなブックマークに追加