最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

GTC Japan 2014

2014年07月16日 00時45分05秒 | Weblog
今日は GTC Japan 2014 です。昨日は前夜祭?に行って来ました。千数百人ぐらいの事前登録があったとの噂です。

イベント名   GTC Japan 2014
主   催   エヌビディア合同会社
共   催   東京工業大学 GPU コンピューティング研究会
日   時   2014年7月16日(水) 10:00 ~ 19:30
場   所   東京ミッドタウンホール & カンファレンス
         http://www.gputechconf.jp
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

2014年日本オペレーションズ・リサーチ学会 秋季研究発表会プログラム公開

2014年07月15日 00時19分35秒 | Weblog
プログラムが公開されました。良く見ると特別講演よりも私の方が講演時間が長くなってます(80分)。

2014年秋季研究発表会 日本オペレーションズ・リサーチ学会秋季研究発表会

テーマ
ORの普及

日程
2014年 8月28日(木)~29日(金)

会場
北海道科学大学

研究発表会・シンポジウムHP: http://www.orsj.or.jp/~nc2014f/

プログラム概要
プログラム詳細
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

HP Moonshot System

2014年07月14日 00時58分46秒 | Weblog
HP Moonshot System について

HP Moonshot System の概要
従来のサーバーは、CPUを中心に設計され、さまざまな用途に使われてきました。そのため、用途によってはCPUがオーバースペックだったり、余計な機能がありすぎて余分なコストがかかる原因にもなっていました。
「HP Moonshot System」は、この従来発想のサーバーとはまったく異なる考え方で設計されたSoftwareDefined Server。つまり、ソフトウェア(アプリケーション/ミドルウェア)に最適化されたサーバーであり、用途に最適なスペックと性能を提供します。

スモールコアCPU「Avoton」で明らかになったIntelのローパワーCPU戦略

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

The 3rd Green Graph500 の結果について

2014年07月13日 00時57分59秒 | Weblog
NVIDIA JetsonTK1 で 200 MTEPS/W 越えというのは、少し意外でした(もっと低いと思ってました)。TEPS値でも 1.63GTEPS ですので、性能値だけ見ると Intel Core i3 ぐらいの性能です。
この値は 204.38 MTEPS/W というのはもっと上げられるのではないかと思います。


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最適化アルゴリズムの進展:理論・応用・実装

2014年07月12日 01時16分17秒 | Weblog
以下の研究集会の発表募集が始まっております。

----------------------------------------------------------------------
京都大学数理解析研究所(RIMS) 研究集会
「最適化アルゴリズムの進展:理論・応用・実装」のご案内
----------------------------------------------------------------------
夏の京都での恒例行事となりました最適化関連の RIMS 研究集会を,
今年は9月下旬に開催いたします.最適化にご興味をお持ちの皆様,
ぜひご参加・ご発表くださいますようご案内申しあげます.

研究集会「最適化アルゴリズムの進展:理論・応用・実装」
http://www.tuat.ac.jp/~miya/RIMS2014/index.html

期間:2014年9月24日(水)~25日(木)
会場:京都大学数理解析研究所420号室
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

IEEE BigData 2014 締切り

2014年07月11日 02時35分56秒 | Weblog
もうすぐ締切りです。

Important Dates:
Electronic submission of full papers: July 13, 2014
Notification of paper acceptance: Sept 1, 2014
Camera-ready of accepted papers: Sept 25, 2014
Conference: October 27-30, 2014

Last update: 27 June 2014

--------------------------------------------------------------------
2014 IEEE International Conference on Big Data (IEEE BigData 2014)

http://cci.drexel.edu/bigdata/bigdata2014/index.htm
October 27-30, 2014, Washington DC, USA

In recent years, “Big Data” has become a new ubiquitous term. Big Data is transforming science, engineering, medicine, healthcare, finance, business, and ultimately society itself. The IEEE Big Data has established itself as the top tier research conference in Big Data. The first conference IEEE Big Data 2013 ( http://cci.drexel.edu/bigdata/bigdata2013/ ) was held in Santa Clara , CA from Oct 6-7, 2013, 259 paper submissions for the main conference and 32 paper submissions for the industry and government program. Of those, 44 regular papers and 53 short papers were accepted, which translates into a selectivity that is on-par with top tier conferences. Also, there were 14 workshops associated with IEEE Big Data 2013 covering various important topics related to various aspects of Big Data research, development and applications, and more than 400 participants from 40 countries attend the 4-day event.

The IEEE International Conference on Big Data 2014(IEEE BigData 2014) continues the success of the IEEE BigData 2013. It will provide a leading forum for disseminating the latest research in Big Data Research, Development, and Applications.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

学際大規模情報基盤共同利用・共同研究拠点 第6回シンポジウム 最終報告

2014年07月10日 00時25分36秒 | Weblog
以下の最終報告でやっと終わります。もう1回やりたいとは思いません。

学際大規模情報基盤共同利用・共同研究拠点 第6回シンポジウム

開催日: 2014年7月10日(木) 10:00~18:30(懇親会 18:30~),      11日(金) 9:30~17:55

開催場所: THE GRAND HALL(品川)
〒108-0075 東京都港区港南2-16-4 品川グランドセントラルタワー 3F
  会場へのアクセス
定  員: 250 名
参加登録: シンポジウム参加無料,  懇親会 3,500 円
    (事前登録〆切: 2014年7月3日(木) 17:00)

-----------------------------------------------------------------------------
内点法アルゴリズムの並列計算による超大規模半正定値計画問題の解決

藤澤克樹(九州大学)

概要 
半正定値計画問題(SDP)に対しては高速かつ安定した反復解法である内点法アルゴリズムが存在しているが,巨大な線形方程式系の計算(行列要素の計算と行列のCholesky分解)が大きなボトルネックとなっている.今回はSDP用の最適化ソルバとして,すでに世界最速級であったSDPARAに対して様々な改良を行った.具体的には前者のボトルネックに対してはCPU アフィニティやメモリインターリーブ技術を駆使し,多数 CPU コア(16,320コア)の並列計算によって高いスケーラビリティを得ることに成功した.また後者のボトルネックに対してはCholesky分解部分の通信と計算のオーバーラップなどに改善を行った.この結果,東工大TSUBAME 2.5の4080台のGPUにより,世界記録更新(233万制約超)およびペタフロップス超(1.713PFlops)の実行速度を達成することに成功した.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

大学における学術研究資源を活用した基盤の戦略的強化について(RU11緊急声明)

2014年07月09日 00時45分12秒 | Weblog
大学における学術研究資源を活用した基盤の戦略的強化について(RU11緊急声明)

このたび、我が国における最先端の研究・人材育成を担う大学である RU11 (北海道大学、東北大学、筑波大学、東京大学、早稲田大学、慶應義塾大学、東京工業大学、名古屋大学、京都大学、大阪大学、九州大学の 11 大学で構成)の総長・塾長・学長は、大学における学術研究資源を活用した基盤の戦略的強化について RU11 の立場から、別紙のとおり声明をまとめましたので、ここに発表いたします。


◯この約10年間ですが、短期的プロジェクトを取りに行く、運営する、終わらせる等の活動の連続で、皆(老いも若きも)かなり消耗した感じは否めないです。
-----------------------------------------------------------------
大学や研究機関においても、4期に及ぶ科学技術基本計画のもとで、科学技術振興投資が行われ、競争的な研究資金が投入されています。一方、我が国の財務構造改革も重要な課題となる中で、大学や公的研究機関についてもより効率的かつ機動的な組織への転換が必要となり、国立大学の法人化や公的研究機関の独立行政法人化が行われ、既に10年あまり経過しました。その間、継続的に必要な組織運営に関わる基盤的財源の不安定化が進む中で、短期的な重点プロジェクトは促進するという状況が常態化し、その結果、組織基盤が大きく弱体化しました。特に、次世代を支える若手研究人材の育成や雇用の劣化をまねいていることは深刻です。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GraphCREST ホームページ:Graph500 と GreenGraph500

2014年07月08日 00時28分59秒 | Weblog
スパコンランキング Graph500 と Green Graph500 で 世界1位 (2冠) を達成

スーパーコンピューティングに関する国際学会 2014 International Supercomputing Conference (ISC'14) にて, グラフ探索性能を用いたスパコンランキング Graph500 とグラフ探索の電力性能を用いたスパコンランキング Green Graph500 で世界1位を獲得しました. また, 今回の結果から我々の開発したソフトウェアは様々な計算機上で高速に動作することを示されました. 今後もさらなる性能向上を目指していきます.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SWoPP 2014 での発表

2014年07月07日 00時48分11秒 | Weblog
SWoPP 2014 で以下の発表があります。SDPARA の Cholesky 分解に関する発表です。


2014年並列/分散/協調処理に関する
『新潟』サマー・ワークショップ(SWoPP新潟2014)

Summer United Workshops on Parallel, Distributed and Cooperative Processing

日程 2014年7月28日(月)~7月30日(水)
会場 朱鷺メッセ 新潟コンベンションセンター
〒950-0078 新潟市中央区万代島6番1号

HPC-15 GPU 2 30 日 17:00 ~ 19:00
(46)
マルチノード GPU 上のコレスキー分解へのデータドリブン型アルゴリズムの適用
辻田裕紀 (東京工業大学), 遠藤敏夫 (GSIC, 東京工業大学)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPARA Cholesky 分解の性能 その2

2014年07月06日 00時47分01秒 | Weblog
以下の問題ですが、結局以下の計算時間と結果で終わりました。

phase.value = pdOPT
Iteration = 30
mu = +7.6198141164019624e-10
relative gap = +2.5334699957772818e-09
gap = +8.4617897755379090e-07
digits = +8.5962842347502679e+00
objValPrimal = -3.3399999916805575e+02
objValDual = -3.3400000001423473e+02
p.feas.error = +3.1984033556953551e-16
d.feas.error = +1.0913595360761974e-08
total time = 17850.511447

Time(sec) Ratio(% : MainLoop)
Predictor time = 17493.624322, 98.003089
Corrector time = 269.572116, 1.510202
Make bMat time = 2312.725925, 12.956394
Make bDia time = 0.000003, 0.000000
Make bF1 time = 0.000000, 0.000000
Make bF2 time = 0.000000, 0.000000
Make bF3 time = 0.000000, 0.000000
Make bPRE time = 0.000000, 0.000000
Make rMat time = 5.907221, 0.033094
Make gVec Mul = 1.917124, 0.010740
Make gVec time = 2.091932, 0.011719
copy gVec time = 0.000003, 0.000000
copy bMat time = 0.000000, 0.000000
symm bMat time = 1201.555535, 6.731376
Cholesky bMat = 13699.679463, 76.748585
Ste Pre time = 0.007532, 0.000042
Ste Cor time = 2.340430, 0.013112
solve = 528.789177, 2.962392
copy DyVec = 0.345439, 0.001935
sumDz = 1.070721, 0.005998
makedX = 10.572704, 0.059231
symmetriseDx = 0.211278, 0.001184
makedXdZ = 11.856249, 0.066421
xMatTime = 2.511153, 0.014068
zMatTime = 3.418216, 0.019150
invzMatTime = 0.000000, 0.000000
xMatzMatTime = 0.000000, 0.000000
EigxMatTime = 0.950597, 0.005325
EigzMatTime = 1.284709, 0.007197
EigxMatzMatTime = 0.000000, 0.000000
updateRes = 1.009352, 0.005655
EigTime = 2.235306, 0.012523
updateRes = 1.009352, 0.005655
EigTime = 2.235306, 0.012523
sub_total_bMat = 15537.348435, 87.043606
Main Loop = 17850.074360, 100.000000
File Check = 0.000000, 0.000000
File Change = 0.007599, 0.000043
File Read = 0.429488, 0.002406
File Trans = 3.602432, 0.020182
Total = 17850.511447, 100.002449

161989 = mDIM
1 = nBLOCK
1114 = bLOCKsTRUCT

◯計算サーバ:GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GTC Japan 2014 : Mobile Computing Session

2014年07月05日 00時20分39秒 | Weblog
今年も GTC Japan で講演することになりました。Mobile Computing のセッションです。

イベント名   GTC Japan 2014
主   催   エヌビディア合同会社
共   催   東京工業大学 GPU コンピューティング研究会
日   時   2014年7月16日(水) 10:00 ~ 19:30
場   所   東京ミッドタウンホール & カンファレンス
申   込   無料(下記ウェブサイトから事前登録制)
         http://www.gputechconf.jp


Day/Time Wednesday, 07/16 13:10 - 13:35
Location: Conference Room 5
Session ID: 2014 - 5001
Tegra K1 プロセッサ上での高速かつ省電力なグラフ探索ソフトウェアの開発
藤澤 克樹
九州大学 マス・フォア・インダストリ研究所 教授

近年、新しいビッグデータ分析の手法として大規模なグラフデータ解析の注目度が高まっている。我々の研究グループではスーパーコンピュータからAndroid 端末まで高速かつ省電力なグラフ探索ソフトウェアの開発を行い、Graph500 ベンチマークなどで優れた結果を残している。本講演では Tegra K1 上で 16億枝/秒の高速性能かつ 2億枝/ワットの省電力性能を発揮するグラフ探索ソフトウェアについて紹介を行う。

Topic Areas:
Mobile Computing
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

HPC ワークショップ in 九州(博多駅)アブストラクト

2014年07月04日 00時49分31秒 | Weblog
HPC Activities in Kyushu
http://imi.kyushu-u.ac.jp/lasm/hpc2014/

日程 平成 26 年 7 月 18 日 (金) 10:00-16:30

場所 JR 博多駅シティ会議室 10 階大会議室

目的 GPU 等のアクセラレータが登場したことによって、 この10年間でハイパフォーマンス・コンピューティング (HPC) 技術の適用範囲が飛躍的に広がりました。 これまでのものづくりや自然現象の予測などの分野に加えて、社会現象の解析と最適化への適応が始まっています。 特にヒト・モノ・カネの移動性や変動性 (いわゆるモビリティ) に関しては実データを用いた都市の中てでの社会実験と共に 大規模データの処理に適したスーパーコンピュータ上での計算による解析の重要性が注目されています。 今回のワークショップでは九州地区での HPC の取り組みを紹介すると共に、 国内外から講演者を招聘して次世代のエクサスケールスーパーコンピュータについての展望等についても紹介いただく予定です。

講演者

Will Ramey (NVIDIA Corporation)
平野徹 (ダイキン情報システム株式会社)
池端昭夫 (TOTO株式会社 生産技術本部)
正田秀明 (株式会社 HPC テック)
南里豪志 (九州大学 情報基盤研究開発センター)
藤澤克樹 (九州大学 マス・フォア・インダストリ研究所)

講演者

Will Ramey (NVIDIA Corporation)
Title: Languages, Libraries and Development Tools for GPU Computing
Abstract: The GPU computing ecosystem continues to expand rapidly, with increasingly powerful ways for developers to incorporate GPU acceleration in their applications. In this session you will learn the key features of CUDA 6 and explore the major programming language solutions, libraries and development tools for GPU computing.
Bio: http://blogs.nvidia.com/blog/author/will-ramey/

平野徹 (ダイキン情報システム株式会社)
題目:「日本のモノづくり再興のための計算科学・スパコンの役割」
概要:日本の製造業がグローバル市場において勝ち続けるために、計算科学やスパコンの役割を述べたい。グローバル製造業のビジネスモデルとして、何をどの市場に提供するかを決定するエンジニアリング・チェーンのグローバル体制について提言する。さらに、新たなモノづくりの源流としての新材料開発や、構造と制御(ハードとソフト)が融合した新商品開発におけるシミュレーション技術の新たな役割を考え、さらに全地球的規模の社会シミュレーションとモノづくりの接点を模索する。

池端昭夫 (TOTO株式会社 生産技術本部)
題目:「節水型水まわり商品における多相流シミュレーション」
概要:TOTOでは、身近な住宅水まわり商品を提供している。世界的な水資源不足への対応とともに、温暖化効果ガス抑制につながる給排水エネルギー削減のため、商品の節水化を急いでいる。衛生陶器等の商品開発では、少ない水で汚れを洗い流す設計に自社製混相流プログラムを活用している。より精度の高い設計を行うため、東京工業大学のスパコン「TSUBAME」を用い、GPGPU大規模並列計算プログラムを開発しており、現状を報告する。

正田秀明 (株式会社 HPC テック)
題目:「日本のスーパーコンピューター -過去・現在・未来-」
概要:スーパーコンピュータとはどんなものかを簡単に紹介した上で、1993年から開始された世界のスーパーコンピューターのTOP500ランキングのデータから視える世界の趨勢、日本の現状を解説します。特に日本のユーザ・ベンダーの過去・現在を俯瞰して、そこに至った経緯を視ます。次に神戸の理化学研究所 計算科学研究機構(AICS)に設置された「京」について述べます。最後に、今、進んでいる「京後継機」開発計画の現状と問題点について述べます。

南里豪志 (九州大学 情報基盤研究開発センター)
題目:「九州大学情報基盤研究開発センターのHPCサービスと研究トピック」
概要:本センターでは、全国の教育研究機関、並びに民間企業に対して HPCサービスを提供している。本講演では、現有の設備やサービスの概要を説明するとともに、利用者支援を担当するセンター研究者の研究テーマを紹介する。

藤澤克樹 (九州大学 マス・フォア・インダストリ研究所)
題目:「世界最高性能のグラフ解析&数理最適化ソフトウェアの開発及び新しい産業応用の推進」
概要:現在、JST CREST による研究プロジェクトでグラフ解析及び数理最適化用のソフトウェア開発を推進している。両者共に最新のスーパーコンピュータ上にて世界最高性能に達すると共に、省電力性能でも非常に高い結果となっている。本講演では我々の研究プロジェクトの紹介と共に、これらの成果を用いたスーパーコンピュータの新しい産業応用の推進についても説明する。

講演スケジュール

10:00 - 10:50 藤澤克樹 (九州大学 マス・フォア・インダストリ研究所)
10:50 - 11:40 南里豪志 (九州大学 情報基盤研究開発センター)
11:40 - 13:00 お昼休み
13:00 - 13:50 正田秀明 (株式会社 HPC テック)
13:50 - 14:40 Will Ramey (NVIDIA Corporation)
14:40 - 14:50 休憩
14:50 - 15:40 平野徹 (ダイキン情報システム株式会社)
15:40 - 16:30 池端昭夫 (TOTO株式会社 生産技術本部)

事前登録

事前登録をお願い致します。
http://docs.google.com/forms/d/1BeBgj458CgGGfoFtUs7ZAMXEIBH-6OKNkRAlp1EYNI4/viewform
締切は 2014 年 7 月 4 日とさせて頂きます。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

個人の HP

2014年07月03日 02時58分13秒 | Weblog
私個人の HP を九州大学のサーバ上に復活させました。

http://sdpa.imi.kyushu-u.ac.jp/~fujisawa/

研究業績
http://sdpa.imi.kyushu-u.ac.jp/~fujisawa/research.html

履歴書
http://sdpa.imi.kyushu-u.ac.jp/~fujisawa/CV.htm
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPARA Cholesky 分解の性能

2014年07月02日 01時24分52秒 | Weblog
SDPARA 7.6.0-G の Cholesky 分解の性能ですが、mDIM = 161989 で1回あたり性能は 470 秒(3013 GFlops)です。

[gpdpotrf] ### END n=161989, nb=2048, 4x4 procs, ver 40: 470.240487sec --> 3013.112174GFlops ###

161989 = mDIM
1 = nBLOCK
1114 = bLOCKsTRUCT

◯計算サーバ:GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする