最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

巨大 SDP 出現 その2

2013年03月31日 22時43分00秒 | Weblog
3003750 = mDIM
2 = nBLOCK
-3499098 2402 = bLOCKsTRUCT

さらにもっと大きな SDP を作りました。この大きさですと、もはや TSUBAME でも解けませんので、TITAN でも借りるよりありません。
コメント (3)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

FPGA

2013年03月30日 22時35分29秒 | Weblog
これから FPGA は流行るのでしょうか?2005年に一度だけ使用したことがありますが、結構好きな分野です。Convey 社などは FPGA で Graph500 の高速化も行なっています。

ハイエンド・ディジタル技術の専門誌「FPGAマガジン」2013年4月25日創刊!

FPGA ボードで学ぶ組込みシステム開発入門 〔Xilinx編〕
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

アカウント停止

2013年03月29日 11時03分21秒 | Weblog

昨年度アカウントを発行していただいた日本の3つのスパコンにおいて、来年度はアカウントの更新を行わないことにしました。理由はもちろんアレです。これで私がアカウントを持っているのは、東工大の TSUBAME だけとなりました。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

巨大 SDP 出現

2013年03月28日 00時23分53秒 | Weblog

非常に大きな SDP を作成しました。今まで最も大きな SDP は 148 万制約だったので、以下の場合では約200万制約になります。もちろん作ろうと思えば、もっと大きな問題も作れます。

1962225 = mDIM
2 = nBLOCK
-2322988 1937 = bLOCKsTRUCT

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Unofficial Green Graph 500 List released

2013年03月27日 10時47分49秒 | Weblog

Unofficial Green Graph 500 List released が公開されました。スパコンと1ノードを単純に比較できませんが、1位の MBP は2GTEPS という高性能なので、省電力系のデバイスを並べて大規模なシステムを作るのも有力な選択肢です。注目は3位の ULP油冷マシンで、昨年の段階では空冷では 20MGTEPS/Wを超えることができず、基盤全体を油冷して各種半導体の温度を下げて何とか超えることができました。現時点では油冷 >> 空冷。BG/Q Mira スパコンは 32767 ノードで 4MTEPS/W という現時点でも驚愕の性能。これに対抗するには油冷等いろいろな方法が考えられますが、今後はビッグデータ処理に強く、省電力なスパコン開発競争が激化する予感が。。。

 

RankMTEPS/WSiteMachineG500 rankScaleGTEPSNodes
1 51.62 Chuo University GraphCREST-Retina15 77 24 1.98735 1
2 40.39 Chuo University GraphCREST-MBA13 97 21 0.953313 1
3 27.34 Tokyo Institute of Technology ULP2012 ultra-green oil-cooled server : GraphCREST 68 24 4.67502 1
4 19.71 Chuo University GraphCREST-SBep2.0 65 25 5.88345 1
5 18.68 Chuo University GraphCREST-SBep2.9 59 25 6.77685 1
6 16.59 Convey Computer Corporation thunder4 47 27 11.614 1
7 16.35 Argonne National Laboratory Celero 48 27 11.448 1
8 16.35 Convey Computer Corporation coconino 50 27 11.444 1
9 15.05 UC Berkeley Scott Beamer's iPad 122 14 0.0304 1
10 13.87 Convey Computer Corporation fox6 44 29 14.56 1
11 10.39 Chuo University GraphCREST-Wex40 52 26 10.4953 1
12 4.34 CNRS/IDRIS-GENCI Turing 6 36 1427 4096
13 3.98 Argonne National Laboratory DOE/SC/Argonne National Laboratory Mira 2 39 10461 32768
14 0.36 Mayo Clinic, Rochester Grace 51 31 10.9415 64
15 0.02 University of Maryland, Baltimore County tara 98 31 0.946 86
16 0.02 Institute of Mathematics and Mechanics UrB RAS URAN 78 29 1.81033 16
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「ビッグデータ利活用のためのシステム研究等」委託業務の公募

2013年03月26日 10時38分20秒 | Weblog
以下の公募が出ています。今年はビッグデータ関係の研究に関しては大きな動きがある予定です。

「ビッグデータ利活用のためのシステム研究等」委託業務の公募
 
文部科学省では、「次世代IT基盤構築のための研究開発」において、各分野における質的・量的に膨大な情報(ビッグデータ)の利活用のためのシステム研究等として、異分野融合型研究拠点によるデータサイエンティスト等の人材育成、データ連携の技術開発課題やアカデミッククラウド環境(大学等間でクラウド基盤を連携・共有するための環境)構築の在り方に関する検討を行うことを目的に、以下の事業を実施します。

 ○締切
   平成25年4月12日(金)12:00時
 ○提案書類の提出
   e-Rad(府省共通研究費管理システム)による申請(一部書類の郵送)。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

enPiT「分野・地域を越えた実践的情報教育協働ネットワーク」

2013年03月25日 14時58分55秒 | Weblog
enPiT「分野・地域を越えた実践的情報教育協働ネットワーク」からいろいろな案内を頂きまして、アンケート等にもお答え致しました。私が大学院生の時には、このようなプログラムがほとんど無かったので、今の大学院生は環境的にも恵まれています。積極的にご参加下さい。

実践×交流世界が求める新しい価値を創る enPiT(エンピット)は最先端の情報技術を実践的に活用することができる人材育成を目指しています。クラウドコンピューティング、セキュリティ、組込みシステム、ビジネスアプリケーションの4つの分野において、大学と産業界による全国的なネットワークを形成し、実践的な情報教育の普及・推進を図ります。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

イノベーション・ジャパン2013

2013年03月24日 14時55分42秒 | Weblog
今年のイノベーション・ジャパン2013は以下の開催予定となっております。
------------------------------------------------------------------------
【イノベーション・ジャパン2013‐大学見本市 開催概要】
会  期:2013年8月29日(木)~8月30日(金) 2日間開催
開催時間:8/29(木) 9:30~17:30
     8/30(金)10:00~17:00
会  場:東京ビッグサイト(東京・江東区有明3-11-1)
     西展示棟 西1ホール
http://www.bigsight.jp/general/access/
主  催:科学技術振興機構(JST)
------------------------------------------------------------------------
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

お知らせ その3

2013年03月23日 14時54分12秒 | Weblog
ほぼ重要な用事は終わりました。明日(24日)に東京に戻ります。戻ってもいろいろと用事が残っておりますので、しばらくは研究面以外で忙しくなります。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

お知らせ その2

2013年03月22日 14時51分57秒 | Weblog
しばらく更新が止まります。東京に戻るのは24日の予定です。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

お知らせ

2013年03月22日 04時23分34秒 | Weblog
プライベートな事情によりまして、しばらくこのブログの更新が滞るかもしれません。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

スパコンでの実験計画 その2

2013年03月21日 01時02分56秒 | Weblog
以下の巨大な SDP だが、最新のプログラム(SDPARA)を TSUBAME 2.0 の 400ノード(4800コア)で実行した場合には、最もボトルネックとなる ELEMENTS の部分の実行が1反復あたり 153.72 秒程度で終了する。16ノード時の実行時間が約 3359.61秒なので、16ノードから400ノード(つまりノード数 25 倍)で 21.85 倍の高速化となっている。

◯ELEMENTSの実行時間 = 153.72 秒/反復 : 400ノード(4800コア)

◯解いた問題 (SDP)
47688 = mDIM
22 = nBLOCK
16 16 16 16 120 120 256 120 120 256 512 256 256 560 1920 1920 560 6032 6032 1920 1920 -554 = bLOCKsTRUCT

◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel X5670 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps

定義:
1. n : SDP の変数と定数行列の大きさ(図2)
2. m : SDP の主問題における制約式の数(図2)
3. # nonzero : 定数行列Ai(i = 0, . . . ,m) における非零要素の総数
4. SCM: 線形方程式系の左辺係数行列(サイズは m x m)
5. ELEMENTS : 係数行列(SCM)の全要素の計算(主要なボトルネックの一つ目)
6. CHOLESKY : 係数行列(SCM)のCholesky 分解(主要なボトルネックの二つ目)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

スパコンでの実験計画

2013年03月20日 10時32分16秒 | Weblog
主な SDP は以下の三つに分類して効率良く処理することが可能である。疎性の追求、計算量やデータ移動量などによる計算方法の自動選択などの技術によって、入力データから密と疎な部分を自動的に抽出する。その後、以下の三つの計算方法が自動的に正しく選択されて、高性能(絶対性能及びスケーリング)に並列処理されることを示す。

1. SCM が疎な場合 ⇒ SCM に対する Parallel Sparse Cholesky 分解の適用
2. SCM が密 かつ n ≧ m の場合 ⇒ CPU に対する affinity の自動設定と多数のCPUコアによる処理(浮動小数点演算性能に非依存:密データへ変換)による SCM 要素の並列高速計算
3. SCM が密 かつn < m の場合 ⇒ 多数GPU と通信の計算のオーバーラップ技術による Parallel Dense Cholesky 分解の適用

定義:
1. n : SDP の変数と定数行列の大きさ(図2)
2. m : SDP の主問題における制約式の数(図2)
3. # nonzero : 定数行列Ai(i = 0, . . . ,m) における非零要素の総数
4. SCM: 線形方程式系の左辺係数行列(サイズは m x m)
5. ELEMENTS : 係数行列(SCM)の全要素の計算(主要なボトルネックの一つ目)
6. CHOLESKY : 係数行列(SCM)のCholesky 分解(主要なボトルネックの二つ目)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

OFEDの最新 Infiniband ドライバ その2

2013年03月20日 01時18分54秒 | Weblog
OFA が開発&推進する Infiniband 系のドライバについて。

OpenFabrics Alliance (OFA)

最近まで最新バージョンは 1.5.4.1 だったが、update が行われたようで、現在の最新バージョンは以下のように 3.5 となっている。

https://www.openfabrics.org/downloads/OFED/ofed-3.5/OFED-3.5.tgz


3.5 を試してみたいのだが、現在正常に動作しているシステムで 3.5 に変更するのは、トラブルが心配でなかなか踏み切れない。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

2013年度 第1回 ORセミナー『 『待ち行列チュートリアル』

2013年03月19日 10時24分46秒 | Weblog
第1回 ORセミナーのお知らせです。学生は参加無料となっています。第2回はまた私が担当するという噂もあります。

2013年度 第1回 ORセミナー『 『待ち行列チュートリアル』

開催趣旨 待ち行列モデルの代表的な分析手法について基礎から学びたい、分析の応用例が知りたい受講者、特に学生・初学者を対象とする。
日 時 2013年4月20日(土)13:00~17:50
会 場  (株)構造計画研究所 本所新館(地下1階 レクチャールーム) 
〒164-0011 東京都中野区中央4-5-3 Tel.03(5342)1065
東京メトロ丸の内線「新中野」駅 1, 2番出口 徒歩約1分
http://www.kke.co.jp/corporate/map/tokyo2.html
コーディネータ
司会 (株)構造計画研究所 斉藤努
定 員 60名 定員になり次第締め切らせていただきます。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする