最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPARA : CPU と GPU

2015年06月15日 00時56分13秒 | Weblog
CUDA 7.0.28 のドロップインライブラリ機能を用いて、SDPARA 7.4.0 からも GPU を呼び出してみた。現在のやり方ではあまり大きな変化は見られない。。。

◯問題 tai18a.dat-s
SDPARA 7.4.0 (CPU のみ) : 2852.48s
SDPARA 7.4.0 (CPU + GPU) : 2860.92s

◯実行したマシン
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
CPU : NVIDIA Tesla K40m x 4
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0



コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

スタディ・グループ ワークショップ 2015

2015年06月14日 00時48分02秒 | Weblog
今年から九州大学開催に関しては COI の共進化システムイノベーション施設を使用します。

スタディ・グループ ワークショップ 2015
URL:http://sgw2015.imi.kyushu-u.ac.jp/

開催期間
2015年7月29日(水) - 7月31日(金)
2015年8月3日(月) - 8月4日(火)

開催場所
7月29日(水) - 7月31日(金)
819-0395 福岡市西区元岡744
九州大学 伊都キャンパス
共進化社会システムイノベーション施設

8月3日(月) - 8月4日(火)
153-8914 東京都目黒区駒場3-8-1
(京王井の頭線駒場東大前駅下車)
東京大学大学院数理科学研究科

Organizing committe by
Kanzo Okada, Chair, Kyushu University
Philip Broadbridge, La Trobe University
Katuki Fujisawa, Kyushu University
Tomoyuki Shirai, Kyushu University
Masato Wakayama, Kyushu University
Hayato Waki, Kyushu University
Masahiro Yamamoto, The University of Tokyo
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

6月 IMI Colloquium

2015年06月13日 21時57分01秒 | Weblog
6月 IMI Colloquium

日時:2015年6月17日(水)
16:45-17:45
場所:九州大学 マス・フォア・インダストリ研究所
大講義室1(数理・IMI図書館棟3F)
講師:安田 雅哉 氏(九州大学 マス・フォア・インダストリ研究所)

講演タイトル:数学と企業における暗号研究

講演要旨:
本講演では、これまで企業で研究してきた暗号研究と数学とのつながりについて紹介します。具体的には、以下の2つのトピックを紹介します。
- 楕円曲線暗号の安全性評価研究
- 準同型暗号の研究開発とその実用化研究
まず、楕円曲線暗号とは、1985年にKoblitz氏とMiller氏が独立に考案した暗号で、楕円曲線が持つ豊富な数学的性質を利用しています。ここでは、楕円曲線の安全性を支える数学問題を紹介すると共に、効率的な解読法とその解読計算量について紹介します。次に、準同型暗号とは暗号化したまま加算や乗算が可能な暗号で、データの機密性やプライバシーを保護したままデータ利活用ができるため、主にクラウドコンピューティング分野への応用が期待されている技術です。本講演では、格子理論に基づく準同型暗号を紹介すると共に、秘匿生体認証や秘匿文字列検索といった応用例についても紹介します。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GPU-Util

2015年06月12日 00時27分35秒 | Weblog
何も実行していないのに、GPU 3 の GPU-Util の値がいつも大きめになっている。NVIDIA に問い合わせたら、あまり気にしなくて良いそうです。。。

nvidia-smi
Fri Jun 12 00:27:18 2015
+------------------------------------------------------+
| NVIDIA-SMI 346.59 Driver Version: 346.59 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla K40m Off | 0000:42:00.0 Off | 0 |
| N/A 40C P0 61W / 235W | 55MiB / 11519MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla K40m Off | 0000:43:00.0 Off | 0 |
| N/A 38C P0 62W / 235W | 55MiB / 11519MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 2 Tesla K40m Off | 0000:81:00.0 Off | 0 |
| N/A 35C P0 62W / 235W | 55MiB / 11519MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 3 Tesla K40m Off | 0000:82:00.0 Off | 0 |
| N/A 38C P0 63W / 235W | 55MiB / 11519MiB | 47% Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+

◯実行したマシン
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
CPU : NVIDIA Tesla K40m x 4
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

総合研究棟(理学系) 6月上旬

2015年06月11日 00時20分00秒 | Weblog
来週からウエスト1号館(理学系)の内覧会が始まります。




コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Study Group Workshop 2015

2015年06月10日 00時28分07秒 | Weblog
Study Group Workshop 2015 を下記の日程・場所で開催します.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
7月29日(問題提起・出題)
7月30日-31日(グループに分かれての作業日)
以上、九州大学伊都キャンパス共進化社会システム
イノベーション施設
http://coi.kyushu-u.ac.jp/

8月3日(午前は問題の復習と途中報告、午後は作業)
8月4日(午前は作業、午後は成果発表)
以上、東大駒場キャンパス
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

K40m 4枚と SDPARA その4

2015年06月09日 00時39分10秒 | Weblog
いろいろとやってみたのですが、7.7.0-G のときは、7.6.0-Gと比較すると以下のようにかなり大きなブロックサイズが必要なようです。

◯ SDPARA 7.7.0-G & CUDA 7.0.28 & 3.1.4
[gt_potrf] ### END n=247131, nb=2048, 2x2 procs, ver 110: 2316.347sec --> 2.172 TFlops ###
[gt_potrf] ### END n=247131, nb=2560, 2x2 procs, ver 110: 1914.541sec --> 2.628 TFlops ###
[gt_potrf] ### END n=247131, nb=3072, 2x2 procs, ver 110: 1677.304sec --> 2.999 TFlops ###
[gt_potrf] ### END n=247131, nb=3584, 2x2 procs, ver 110: 1474.105sec --> 3.413 TFlops ###
[gt_potrf] ### END n=247131, nb=4096, 2x2 procs, ver 110: 1402.937sec --> 3.586 TFlops ###
[gt_potrf] ### END n=247131, nb=4608, 2x2 procs, ver 110: 1326.274sec --> 3.793 TFlops ###
[gt_potrf] ### END n=247131, nb=5120, 2x2 procs, ver 110: 1295.715sec --> 3.883 TFlops ###
[gt_potrf] ### END n=247131, nb=5632, 2x2 procs, ver 110: 1253.319sec --> 4.014 TFlops ###
[gt_potrf] ### END n=247131, nb=5888, 2x2 procs, ver 110: 1276.265sec --> 3.942 TFlops ###
[gt_potrf] ### END n=247131, nb=6144, 2x2 procs, ver 110: 1262.074sec --> 3.986 TFlops ###

◯ SDPARA 7.6.0-G & CUDA 7.0.28 & mpich 3.1.4
[gpdpotrf] ### END n=247131, nb=2048, 2x2 procs, ver 50: 1206.868sec --> 4168.698GFlops ###


◯実行したマシン
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
CPU : NVIDIA Tesla K40m x 4
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0



コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

K40m 4枚と SDPARA その3

2015年06月08日 01時57分24秒 | Weblog
7.7.0-G ではブロックサイズは大きい方が良いようです。それでも性能はまだ低めです。。。

◯ SDPARA 7.7.0-G & CUDA 7.0.28 & 3.1.4
[gt_potrf] ### END n=247131, nb=2048, 2x2 procs, ver 110: 2316.347sec --> 2.172 TFlops ###
[gt_potrf] ### END n=247131, nb=2560, 2x2 procs, ver 110: 1914.541sec --> 2.628 TFlops ###
[gt_potrf] ### END n=247131, nb=3072, 2x2 procs, ver 110: 1677.304sec --> 2.999 TFlops ###

◯ SDPARA 7.6.0-G & CUDA 7.0.28 & mpich 3.1.4
[gpdpotrf] ### END n=247131, nb=2048, 2x2 procs, ver 50: 1206.868sec --> 4168.698GFlops ###


◯実行したマシン
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
CPU : NVIDIA Tesla K40m x 4
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0




コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

K40m 4枚と SDPARA その2

2015年06月07日 10時07分30秒 | Weblog
K40m 4枚使用時の SDPARA の性能は以下の通り。何故か 7.7.0-G の方が性能低下してます。。。

◯ SDPARA 7.7.0-G & CUDA 7.0.28 & 3.1.4
[gt_potrf] ### END n=247131, nb=2048, 2x2 procs, ver 110: 2316.347sec --> 2.172 TFlops ###

◯ SDPARA 7.6.0-G & CUDA 7.0.28 & mpich 3.1.4
[gpdpotrf] ### END n=247131, nb=2048, 2x2 procs, ver 50: 1206.868sec --> 4168.698GFlops ###


◯実行したマシン
Huawei RH5885H V3
CPU :Intel Xeon E7-4890 v2 x 4 socket
CPU : NVIDIA Tesla K40m x 4
Memory :2.0TB (32GB LRDIMM x 64 DIMMs)
HDD :2.5-inch 300GB SAS 15000rpm HDD x 2
SSD : ES3000 2.4TB x 2 + 2.5-inch 800GB SSD (Intel DC S3500) x 8
RAID :RAID-0/1/10/5/50/6/60 1GB Cache with Power Protection
NIC :On Board 1GE x 4 port interface card
I/O Box :6 Slot Riser Card x 2、Hot-Plugged Riser Card x 1
PSU :2000W Platinum AC Power Supply Unit x 2
Rail :4U Slide Rail with Cable Management Arm
OS : CentOS 7.0




コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

数学・数理科学の視点からのエンジン適合の研究:再掲載

2015年06月06日 03時09分39秒 | Weblog
こちらの短期共同研究も間近に迫ってきましたので、再掲載致します。

6/17(水)- 6/18(木),IMIの短期共同研究の講演会
「数学・数理科学の視点からのエンジン適合の研究 」
研究代表者:佐藤 正浩 (株式会社本田技術研究所)
http://www.imi.kyushu-u.ac.jp/events/view/1593

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

「数学・数理科学の視点からのエンジン適合の研究」
2015年6月17日(水)- 6月18日(木)
九州大学マス・フォア・インダストリ研究所 3階 中セミナー室2


6月17日(水)

13:30-14:30
脇 隼人(九大IMI
前回までの議論の復習

14:30-15:00
岩瀬 将美, 永長 克章, 芹澤 卓哉(東京電機大学)
エンジンベンチマークに対するロジスティック回帰の有効性の検証

15:30-17:00
大畠 明(トヨタ自動車株式会社)
動的境界モデルの考察



6月18日(木)

10:30-11:00
渡邊 智 (トヨタ自動車株式会社)
効率の良い凸包の計算について

13:00-14:00
脇 隼人, 落合 啓之(九大IMI)
SGW2014のデータに対する考察

14:00-14:15
落合 啓之(九大IMI)
依存しない変数に関するコメント

14:30-15:30
佐藤 正浩, 下城 孝名子(ホンダ技術研究所)
SGW2014で用いたデータの境界探索法

15:30-16:30 議論

* 今回の議論をふまえて, 第二回を11月中旬に開催予定
* スケジュールは予告なく変更されることがあります.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

H27春季 東工大 GSIC グランドチャレンジ結果

2015年06月05日 01時36分47秒 | Weblog
半正定値計画問題(SDP)用の最適化ソルバとして、すでにTSUBAME2.5上において1.7PFlopsを記録し、世界最速であるSDPARA に対してさらなる改良を行った。
より具体的には、SDPARAコードへ下記のような大幅追加・変更を行った:Cholesky分解計算を適切な粒度でタスクグラフ化し、データドリブン実行する技術を組み込んだ。一度のCholesky分解は数百万~数億個の小タスクから成り立ち、各小タスクの一つあたりの実行時間はおよそ10msのオーダーであり、各計算ノードに割り当てられ、それぞれのGPUにより次々に実行される。さらに行列保持のためのメモリ領域を節約するために、行列の下三角行列のみを保持することとし、必要な変更を加えた。これにより、標準的な密行列演算パッケージであるSCALAPACKに比べ、半分のメモリ消費で済む
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

6月 IMI Colloquium

2015年06月04日 01時47分18秒 | Weblog
6月 IMI Colloquium

日時:2015年6月17日(水)
16:45-17:45
場所:九州大学 マス・フォア・インダストリ研究所
大講義室1(数理・IMI図書館棟3F)
講師:安田 雅哉 氏(九州大学 マス・フォア・インダストリ研究所)

講演タイトル:数学と企業における暗号研究

講演要旨:
本講演では、これまで企業で研究してきた暗号研究と数学とのつながりについて紹介します。具体的には、以下の2つのトピックを紹介します。
- 楕円曲線暗号の安全性評価研究
- 準同型暗号の研究開発とその実用化研究
まず、楕円曲線暗号とは、1985年にKoblitz氏とMiller氏が独立に考案した暗号で、楕円曲線が持つ豊富な数学的性質を利用しています。ここでは、楕円曲線の安全性を支える数学問題を紹介すると共に、効率的な解読法とその解読計算量について紹介します。次に、準同型暗号とは暗号化したまま加算や乗算が可能な暗号で、データの機密性やプライバシーを保護したままデータ利活用ができるため、主にクラウドコンピューティング分野への応用が期待されている技術です。本講演では、格子理論に基づく準同型暗号を紹介すると共に、秘匿生体認証や秘匿文字列検索といった応用例についても紹介します。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

数学理論先進ソフトウェア開発室:室長

2015年06月03日 00時53分55秒 | Weblog
以下の所員一覧を見ますと、数学理論先進ソフトウェア開発室で専任の教授は私しかいませんので、形式上も実質上も私が開発室の室長となっております。

数学理論先進ソフトウェア開発室

当開発室では,主にMI研究所で発見された数学の理論や定理をアルゴリズム化し,さらにソフトウェアとして実装することを目的としています.制作したソフトウェアは,産業界および数学自身を含む諸科学分野における最先端研究現場の使用に資するよう,国際的に公開していく予定です.

数学理論先進ソフトウェア開発室 所員一覧
白井 朋之 (教授) (兼任) ... 確率論、ランダム行列、グラフ上のランダムウォーク
高木 剛 (教授) (兼任) ... 暗号理論,情報セキュリティ,計算整数論
藤澤 克樹 (教授) ... 最適化問題,グラフ解析,高性能計算
二宮 嘉行 (准教授) (兼任) ... 数理統計学,計量生物学
溝口 佳寛 (准教授) ... ソフトウェア科学、グラフ変換理論、計算理論
脇 隼人 (准教授) ... 最適化, 数理計画, 連続最適化, 半正定値計画問題, 最適化ソフトウェア
渋田 敬史 (助教) ... 計算代数, 可換環論, 代数幾何
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

CPSによるデータ駆動型社会の到来を見据えた変革

2015年06月02日 03時34分38秒 | Weblog
情報経済小委員会 中間取りまとめ報告書について

CPSによるデータ駆動型社会の到来を見据えた変革

1. 背景
IoT・ビッグデータ・AI等のITの技術革新によって、実世界から得られたデータを分析・解析し、その結果を再び実世界にフィードバックするというサイバーフィジカルシステム(CPS)が現実のものになっています。これにより、全ての産業でデータを核としたビジネスモデルの革新が産業の垣根を越えて生じ、今後は産業構造の大変革が予想されます。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

大規模データに対する最大フロー求解アルゴリズムの実装技術の構築:その2

2015年06月01日 01時36分24秒 | Weblog
公開ワークショップは6月9日ですが、研究集会自体は8日から12日まで続きます。

大規模データに対する最大フロー求解アルゴリズムの実装技術の構築

種別 短期共同研究
研究計画題目 大規模データに対する最大フロー求解アルゴリズムの実装技術の構築
研究代表者 瀧澤重志(大阪市立大学・工学研究科・准教授)
研究実施期間 平成27年6月8日(月)~ 平成27年6月12日(金)
研究分野のキーワード グラフ解析,離散最適化,高性能計算,最大フロー,アプリケーション開発,防災

※ この研究集会はマス・フォア・インダストリ研究所 共同利用研究の公開プログラムです.

開催日
2015年6月9日(火)

開催場所
九州大学 伊都キャンパス 数理学研究教育棟/マス・フォア・インダストリ研究所3F 中セミナー室7
伊都キャンパスへのアクセス,伊都キャンパスマップ

【プログラム】
(全7講演)
6月9日(火)

10:00 - 10:40
講演タイトル《普遍的最速流アルゴリズム実装の詳細と課題》
講演者:小林 和博 (海上技術安全研究所)

10:50 - 11:30
講演タイトル《普遍的最速流計算における最大流アルゴリズム》
講演者:安井 雄一郎 (九州大学共進化社会システム創成拠点)

11:30 - 13:00 昼食 & 休憩

13:00 - 13:40
講演タイトル《梅田地下街の浸水避難計画に対する数理技術を用いた支援》
講演者:瀧澤 重志 (大阪市立大学)

13:50 - 14:30
講演タイトル《歩車混合避難計画問題》
講演者:神山 直之 (九州大学 IMI/ JSTさきがけ)

14:40 - 15:20
講演タイトル《津波避難計画の前提となる高精度津波シミュレーションと,被災後復旧段階における湛水域と道路網について》
講演者:佐藤 憲一郎 (海洋研究開発機構)

15:20 - 15:50 休憩

15:50 - 16:30
講演タイトル《Pythonによるグラフ・ネットワーク最適化》
講演者:斉藤 努 (株式会社構造計画研究所)

16:40 - 17:20
講演タイトル《グラフ解析と最適化技術で実現する都市OS》
講演者:藤澤 克樹 (九州大学IMI / JST CREST)

※ 各講演のアブストラクトはこちら(ホームページ)をご覧ください.

組織委員
瀧澤 重志 (大阪市立大学・准教授)
清水 正明 (日立製作所 中央研究所 PS部・部長代行)
斉藤 努 (株式会社構造計画研究所・テクニカルマネージャー)
藤澤 克樹 (九州大学マス・フォア・インダストリ研究所・教授)
神山 直之 (九州大学マス・フォア・インダストリ研究所・准教授)
佐藤 憲一郎 (独立行政法人海洋研究開発機構・特任研究員)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする