最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

NVIDIA DGX-2

2018年05月31日 00時11分35秒 | Weblog
NVIDIA DGX-2

世界初の 2 ペタフロップスのシステム、NVIDIA DGX-2 は、16 基の完全相互接続 GPU で、ディープラーニングのパフォーマンスを 10 倍に引き上げ、AI の速度と規模の壁を打ち破ります。NVIDIA® DGX™ ソフトウェアと、NVIDIA NVSwitch テクノロジに基づくスケーラブルなアーキテクチャを搭載しているため、世界最高レベルの複雑な AI の課題に取り組むことができます。

前例のないトレーニングに対応する強力な計算処理能力
AI はますます複雑化しており、計算処理能力でもこれまでにないレベルが求められています。NVIDIA® DGX-2 は、最新鋭の GPU を 16 基搭載し、これまでトレーニング不可能だった、新しいタイプの AI モデル を高速化します。さらに、画期的な GPU のスケーラビリティにより、単一のノードで 4 倍大きなモデルのトレーニングが可能で、パフォーマンスも GPU 8 基のシステムの__倍になります。

革新的な AI ネットワーク構造
DGX-2 では、モデルの複雑さやサイズに関する従来のアーキテクチャの制約を受けることがなくなりまます。NVIDIA NVSwitch ネットワーク構造により、大規模なモデル並列トレーニングが可能になります。これは、2.5 TB/s の GPU 間帯域幅を誇る世界初の 2 ペタフロップス GPU アクセラレータの先進的テクノロジによるものであり、旧世代と比べ 12 倍の速度向上を実現し、解決までの時間を 5 分の 1 に短縮します。

まったく新しいレベルで AI のスケーリングを迅速に行う方法
現代の企業では、ビジネスの要求に応じて、AI の機能を迅速に導入しなければなりません。DGX-2 はすぐに利用可能なモジュラー式ソリューションにより、AI の素早いスケーリングを実現します。DGX-2 では、最大規模のディープラーニング計算クラスターを構築できる柔軟なネットワーク オプションと、共有インフラストラクチャ環境でのユーザーとワークロードの分離を改善する安全なマルチテナント機能の組み合わせにより、AI のスケーリングを素早く、簡単に行うことができます。高速の導入モデルと、スケーリングが簡単な専門のアーキテクチャにより、チームは創造的な作業にかける時間を増やし、インフラストラクチャ構築にかける時間を減らすことができます。

エンタープライズ グレードの、24 時間稼働 AI インフラストラクチャ
AI が不可欠なビジネスでは、高い信頼性、可用性、運用性 (RAS) を目指して設計された、安心して運用できるプラットフォームが必要です。DGX-2 は RAS を考慮して専門に構築されており、予定外のダウンタイムの削減、運用性の合理化、動作の継続性の維持を実現します。DGX-2 はエンタープライズ グレードのシステムであり、NVIDIA のノウハウによるバックアップを受けることができます。厳しい 24 時間の稼働に耐える設計で、重要な AI を絶え間なく動作させます。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

NTT研究所インターンシップ

2018年05月30日 21時13分05秒 | Weblog
NTT研究所インターンシップ

約1ヵ月間に及ぶ、実践型インターンシップ
NTT研究所の夏期インターンシップは、夏の1ヵ月間を活用した実践型インターンシップです。基礎研究、基盤的研究からNTTグループのサービスにつながる応用研究開発にいたるまで、さまざまなコースをご用意しています。

日本最先端の研究開発プロジェクトメンバーに
インターンシップに参加する学生の皆さんは、実際にNTTの研究者と机を並べて、指導者の下で研究開発を行います。未来を切り拓く最先端の技術に触れることで、皆さんの知的好奇心を刺激する内容となっています。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Fedora 28

2018年05月29日 21時08分48秒 | Weblog
Fedora 28 がリリースされたので、Fedora 27 の計算サーバに対してアップグレードの作業を行いました。

「Fedora 28」リリース、「モジュラーリポジトリ」を導入

Fedora Projectは5月1日、Linuxディストリビューション「Fedora 28」を公開した。 Workstation、Server、Atomic Hostの3種類のエディションが提供されており、プロジェクトのWebサイトより入手できる。Fedora 28は、2017年11月に公開したFedora 27に続く最新版で、当初のスケジュール通りの公開となった。Linuxカーネルのバージョンは4.16。

Upgrading Fedora 27 Workstation to Fedora 28
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新 GPU クラスタ 性能測定 その17

2018年05月28日 21時31分20秒 | Weblog
CentOS 7.5 がリリースされましたので、最新の組み合わせ(CentOS 7.5 & SDPARA 7.6.1 & OpenMPI 3.1.0 & Intel Compiler 18.0.2)で実験してみました。。。

クロックアップ
nvidia-smi -i 0 -ac 3004,875"
Applications clocks set to "(MEM 3004, SM 875)" for GPU 00000000:81:00.0

1: クロックアップ後
◯ CentOS 7.4 & SDPARA 7.6.1 & OpenMPI 3.0.0 & Intel Compiler 18.0.1
[gpdpotrf] ### END n=379350, nb=2048, 4x4 procs, ver 50: 990.664sec --> 18368.452GFlops ###

◯ CentOS 7.4 & SDPARA 7.6.1 & OpenMPI 3.0.1 & Intel Compiler 18.0.2
[gpdpotrf] ### END n=379350, nb=2048, 4x4 procs, ver 50: 1000.466sec --> 18188.486GFlops ###

◯ CentOS 7.5 & SDPARA 7.6.1 & OpenMPI 3.1.0 & Intel Compiler 18.0.2
[gpdpotrf] ### END n=379350, nb=2048, 4x4 procs, ver 50: 997.336sec --> 18245.582GFlops ###



◯追加分
ノード数4
各ノード
CPU : Intel(R) Xeon(R) CPU E5-2650 v3 @ 2.30GHz x 2 : 10cores / 1CPU
GPU : NVIDIA K40m x 2
メモリ:256GB
ネットワーク:GbE x 2 + Mellanox Infiniband FDR x 2
HDD : HP 1000GB 7.2krpm SC 2.5型 6G SATA ハードディスクドライブ
OS : CentOS 7.4


◯現在の GPU クラスタ
ノード数4
各ノード
CPU : Intel(R) Xeon(R) CPU E5-2640 v3 @ 2.60GHz x 2 : 8cores / 1CPU
GPU : NVIDIA K40m x 2
メモリ:256GB
ネットワーク:GbE x 2 + Mellanox Infiniband FDR x 2
HDD : HP 500GB 7.2krpm SC 2.5型 6G SATA ハードディスクドライブ
OS : CentOS 7.4









コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

The 3rd IMI-ISM-ZIB MODAL Workshop

2018年05月27日 00時33分20秒 | Weblog
The 3rd IMI-ISM-ZIB MODAL Workshop on Challenges in Real World Data Analytics and High-Performance Optimization


Organizers
Katsuki Fujisawa : The Institute of Mathematics for Industry, Kyushu University & AIST-Tokyo Tech Real World Big-Data Computation Open Innovation Laboratory
Satoshi Ito : The Institute of Statistical Mathematics
Thorsten Koch : Research Campus MODAL / ZIB
Yuji Shinano : MODAL SynLab / ZIB
Takashi Tsuchiya : National Graduate Institute for Policy Studies

Outline
The Institute of Statistical Mathematics (ISM) in Tokyo, Zuse Institute Berlin (ZIB) and the Institute of Mathematics for Industry (IMI) of Kyushu University have established collaboration agreements in 2016, confirming the mutual interest in cooperation for research in applied mathematics and initiating a regular exchange between the institutes.
The first ISM-ZIB-IMI Joint workshop was carried out at ISM in Tokyo, Japan, from 2017-01-19 to 2017-01-22, as the first step in collaborative research in optimization and data-intensive High-Performance Computing. Special focus was the organization of cooperation between research and industry. The second ISM-ZIB-IMI MODAL workshop on Mathematical Optimization and Data Analysis was held at ZIB in Berlin, Germany, from 2017-09-22 to 2017-09-26, as a workshop evolving the first joint workshop. Speakers from science and industry presented progressive achievement.
To build up on the success of the previous workshops the " 3rd IMI-ISM-ZIB MODAL Workshop on Challenges in Real World Data Analytics and High- Performance Optimization" will take place from 2018-09-26 to 2018-10-01 at the National Graduate Institute for Policy Studies (GRIPS) in Tokyo, Japan.

Speakers
TBD

Program
26.09.2018: SCIP Introduction
27.09.2018: Workshop talks
28.09.2018: Workshop talks and the two panel discussions, Banquet.
01.10.2018: Japanese supercomputer tour ABCI
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

2018年度AIMaP集会等公募 (〆切:2018年6月4日)

2018年05月26日 22時14分33秒 | Weblog
2018年度AIMaP集会等公募 (〆切:2018年6月4日)

2017年度より開始しているAIMaP事業は、全国の数学・数理科学研究者と諸科学分野や産業界の研究者・技術者とが交流する集会等の開催を支援し、共同研究への発展を促すとともに、そこで得られた知見・経験の共有や横断的展開を図ることを考えています。そこで、以下の通り募集致します。

■公募の内容
以下の集会等の開催を公募します。

1.諸科学・産業界向けの集会
(例) 諸科学分野の学会や産業界の集会等において数学応用研究事例を紹介する会合、数理的手法・理論のチュートリアル、企業と学生との交流会

2.諸科学・産業からの問題提示型集会
(例) スタディグループ(企業や諸科学分野から提示された問題の解決策について、数学・数理科学の研究者や学生が一定期間集中して議論する集会)、諸科学・産業が抱える問題を数学・数理科学者向けに紹介する集会

3.その他の集会
(例) 特定のテーマやトピックについて諸科学・産業関係者と数学・数理科学研究者が議論するワークショップ、広く一般向けに数学応用研究事例などを紹介する集会、諸科学・産業との連携の先進的取組やノウハウを共有する集会

■申請できる経費
国内および外国旅費 (講演者等の交通費・宿泊費・日当)、諸謝金、印刷製本費、借損料 (会場借料等)。
その他の経費については、必要に応じ主催機関等が負担してください。
一つの集会等に対して申請できる金額の合計は、原則として50万円以内とします。

■公募要領・審査要領:下記リンクよりダウンロードしてください。
●公募要領 (pdf)
●公募申請書 (Word)
●審査基準(案) (pdf)

申請から採択までのスケジュール
4月27日(金) 電子申請受付開始
6月 4日(月) 17時 申請締切(電子申請のみ)
*登録後に承諾書をご提出いただきます。
7月上旬 採択結果通知
参考) 2017年度採択研究集会一覧

■申請方法
公募申請書をダウンロードして記入の上、申請用ウェブページ(https://aimap.imi.kyushu-u.ac.jp/wp/shinsei2018)より申請手続きを行ってください。
* 申請後、承諾書(主催機関代表者の押印)の提出が必要となります。
ご登録後にAIMaP事務局よりご連絡いたします。
* 公募申請書ファイルはWordファイルのままアップロードしてください。
* 内容を修正される場合は、同ページより再申請手続きを行ってください。

■開催時期および開催場所
2018年7月から2019年3月までに国内で開催し、年度末までに会計処理を完了できるような計画をお願いします。

■採択後の手続き
予算執行についてはAIMaP事務局にご相談下さい。
研究集会等開催後、実施報告書と補助資料(写真、講演スライド)をご提出いただきます。
また、開催の半年後を目途にフォローアップ調査を実施いたします。

■問い合わせ先
〒819-0395 福岡市西区元岡744 
九州大学マス・フォア・インダストリ研究所
AIMaP事務局
Tel: 092-802-4494
Email: aimap@imi.kyushu-u.ac.jp
URL: https://aimap.imi.kyushu-u.ac.jp/wp/
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Announcing CUDA 9.2

2018年05月25日 23時10分55秒 | Weblog
Announcing CUDA 9.2

CUDA 9.2 includes updates to libraries, a new library for accelerating custom linear-algebra algorithms, and lower kernel launch latency.

With CUDA 9.2, you can:

Speed up recurrent and convolutional neural networks through cuBLAS optimizations
Speed up FFT of prime size matrices through Bluestein kernels in cuFFT
Accelerate custom linear algebra algorithms with CUTLASS 1.0
Launch CUDA kernels up to 2X faster than CUDA 9 with new optimizations to the CUDA runtime
Additionally, CUDA 9.2 includes bug fixes and supports new operating systems and popular development tools. Join the NVIDIA Developer Program to find out when CUDA 9.2 is available for download.

コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi Optimizer 8.0 リリース

2018年05月24日 00時54分27秒 | Weblog
Gurobi Optimizer の新バージョン8.0が、2018年4月27日にリリースされました。
本リリースは、メジャーバージョンリリースです。

【8.0で対応された改良および機能拡張内容】

(パフォーマンス改良)
・混合整数計画法(MIP):総体的に16%求解速度改良を実現。
             求解に100秒以上かかる難しいモデルでは26%の求解速
度の改良を実現。
・線形計画法(LP) :双対単体法が、総体的に10%の求解速度改良を実現。


(機能拡張)
・RおよびMATLABのAPIの機能強化
・.NET Core 2.0のサポート
・Multiple MIP Startsのサポート
・Partition ヒューリステックのサポート
・多目的最適化のためのコールバック関数

本リリースの詳細は、下記のサイトをご参照ください。
https://www.octobersky.jp/products/gurobi_version.html
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本OR学会 研究発表会

2018年05月23日 00時18分23秒 | Weblog
日本OR学会 研究発表会

2018年秋季研究発表会
日 程
2018 年9 月6 日(木)~7 日(金)

場 所
名古屋市立大学

実行委員長
田地宏一(名古屋大学)


2019年春季研究発表会
日 程
2019 年3 月14日(木)~15日(金)

場 所
千葉工業大学

実行委員長
岩下 基(千葉工業大学)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

gcc 8.1.0 と gcc 4.8.5 その2

2018年05月22日 01時45分09秒 | Weblog
gcc 8.1.0 がリリースされていますので、gcc 4.8.5 がインストールされている CentOS 7.4 上で以下の比較実験を行ってみました。
前回は SDP でしたが、今回は線形計画問題です。

線形計画問題:30.new.mps
◯ glpk 4.65
gcc 4.8.5 : 28.134s
gcc 8.1.0 : 28.043s

◯ scipoptsuite-5.0.1
gcc 4.8.5 : 49.585s
gcc 8.1.0 : 48.972s


◯計算サーバ
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2個
メモリ:512GB
GPU : NVIDIA Tesla P100 x 2
OS : CentOS 7.4
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

gcc 8.1.0 と gcc 4.8.5 その1

2018年05月21日 00時45分09秒 | Weblog
gcc 8.1.0 がリリースされていますので、gcc 4.8.5 がインストールされている CentOS 7.4 上で以下の比較実験を行ってみました。

◯ソフトウェア SDPA 7.4.1
◯問題1:karate.dat-s
gcc 4.8.5 : 152.56s
gcc 8.1.0 : 151.74s

◯問題2:DSJC500.9.dat-s
gcc 4.8.5 : 46.57s
gcc 8.1.0 : 46.72s

◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.8.5 : 158.76s
gcc 8.1.0 : 157.87s

◯問題4:theta8.dat-s
gcc 4.8.5 : 15.11s
gcc 8.1.0 : 15.46s


◯計算サーバ
CPU : Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz x 2個
メモリ:512GB
GPU : NVIDIA Tesla P100 x 2
OS : CentOS 7.4
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

JR博多シティ RF つばめの杜ひろば:展望 5月4日撮影

2018年05月20日 21時59分42秒 | Weblog
どんたく開催が見えました。伊都キャンパスははるか遠くで全く見えません。。。






















コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本企業の研究開発、世界に遅れ

2018年05月19日 19時28分01秒 | Weblog
日本企業の研究開発、世界に遅れ

日本企業の研究開発費の伸びが海外企業に劣っている。2017年までの10年間の伸び率を比較するとアジアの4.1倍、米国の86%増に対して日本は12%増にとどまる。日本企業は事業の「選択と集中」で効率を高める半面、パナソニックやソニーなどが研究開発費の世界ランキングで順位を大きく落とした。AI(人工知能)などIT(情報技術)分野で米国勢やアジア勢が投資を飛躍的に増やして第4次産業革命を主導する中、研…

[有料会員限定] この記事は会員限定です。電子版に登録すると続きをお読みいただけます。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

2018年度 人工知能学会全国大会 (第32回)

2018年05月18日 00時18分24秒 | Weblog
私自身は東京で開催される OIL 合同シンポジウムに参加するため、以下には参加出来ませんが。。。

2018年度 人工知能学会全国大会 (第32回)
2018年6月5日(火)〜6月8日(金) 鹿児島県鹿児島市(城山観光ホテル)

AI応用-画像応用
2018年6月6日(水) 09:00 〜 10:40 D会場 (4F カトレア)

09:00 〜 09:20
[2D1-01] グラフ最適化を用いた多人数追跡手法におけるグリッドマップ生成の並列化
〇西川 由理1,2、佐藤 仁1、小澤 順1 (1. 産業技術総合研究所、2. パナソニック株式会社)

09:20 〜 09:40
[2D1-02] 多人数追跡のための分散深層学習による高精度な検出にむけて
〇佐藤 仁1、西川 由理1,2、小澤 順1 (1. 産業技術総合研究所、2. パナソニック)

09:40 〜 10:00
[2D1-03] K-Shortest Pathsを用いた多人数追跡におけるデータ削減による高速化
〇秦 希望1、西川 由理3,4、中山 俊1、小澤 順3、藤澤 克樹2,3 (1. 九州大学大学院数理学府、2. 九州大学マス・フォア・インダストリ研究所、3. 産業技術総合研究所、4. パナソニック株式会社)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Hybrid Vehicle Control and Optimization with a New Mathematical Method

2018年05月17日 00時33分00秒 | Weblog
Hybrid Vehicle Control and Optimization with a New Mathematical Method

Nariaki Tateiwa Nozomi Hata Akira Tanaka
Takashi Nakayama Akihiro Yoshida Takashi Wakamatsu
Graduate School of Mathematics, Kyushu University, Fukuoka, Japan

Katsuki Fujisawa
Institute of Mathematics for Industry, Kyushu University, Fukuoka
& AIST-Tokyo Tech Real World Big-Data Computation Open
Innovation Laboratory, Tokyo, Japan

Abstract:
In Hybrid Electric Vehicle (HEV) system, researches using model-based simulators have been actively conducted. The vehicle powertrain simulator makes it easier to evaluate the powertrain system. In this paper, we utilize Toyota Hybrid System (THS) simulator to obtain the long-term control that optimizes the fuel efficiency where the vehicle speed of a certain period is given. Our proposed method achieves to obtain the optimal long-term control by solving the shortest path problem with State of Charge (SOC) constraints after constructing a graph expressing the transition of the fuel and battery consumption. We also propose the search method of the vehicle control by Bicubic Spline Interpolation (BSI) without preparing any controller. We finally removed almost all edges from the graph at most 97.2% by utilizing 0-1 Integer Linear Programming (0-1ILP), which enabled 3.88x speedups on obtaining the optimal vehicle control.

Keywords: Hybrid vehicles, Graph theory, Computer simulation, Optimal control, Function approximation, Optimization problem
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする