最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

GeForce GTX TITAN & Tesla C2075 その2

2013年05月31日 01時55分42秒 | Weblog
GeForce GTX TITAN と Tesla C2075 の性能比較の第2回。GeForce GTX TITAN 2枚 >> Tesla C2075 4枚という結果。。。

◯ソフトウェア SDPARA 7.5.0
◯問題:tai18a.dat-s

1: GeForce GTX TITAN x 1枚
n=47142, nb=1024 took 51.783271sec --> 674.393347GFlops

2: GeForce GTX TITAN x 2枚
n=47142, nb=1024 took 33.458297sec --> 1043.755853GFlops



3:Tesla C2075 x 4 枚
n=47142, nb=1024 took 43.467272sec --> 803.415804GFlops


コメント
この記事をはてなブックマークに追加

GeForce GTX TITAN 2枚差し

2013年05月30日 00時59分44秒 | Weblog
GeForce GTX TITAN 2枚差しのマシンを入手しました。いろいろと設定が難しいところもありますが、以下のように高いメモリバンド幅が出ます。

./bandwidthTest --device=all
[CUDA Bandwidth Test] - Starting...

!!!!!Cumulative Bandwidth to be computed from all the devices !!!!!!

Running on...

Device 0: GeForce GTX TITAN
Device 1: GeForce GTX TITAN
Quick Mode

Host to Device Bandwidth, 2 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 11721.9

Device to Host Bandwidth, 2 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 12800.6

Device to Device Bandwidth, 2 Device(s)
PINNED Memory Transfers
Transfer Size (Bytes) Bandwidth(MB/s)
33554432 440320.1

コメント
この記事をはてなブックマークに追加

Call for Special Sessions of ICOTA 9

2013年05月29日 01時28分18秒 | Weblog
12月に台湾で開催される ICOTA 9 ですが、以下のように特別セッションの提案締切りが6月15日に延長になりました。

Call for Special Sessions of ICOTA 9

Each special session is 90 minutes in length and should consist at least 3 articles. You are also welcome to organize a special stream which could include more than one session. The organizer(s) of a special session should send an email with subject “ICOTA9 Special Session Submission (Name of the Special Session)” to:

ICOTA2013@gmail.com or ICOTA2013@mail.ntust.edu.tw

by June 15 ,2013. The submission should include the following information:

Title of the special session (stream).
Name(s)/affiliation(s) of organizer(s), and contact email address.
Abstracts of papers contributed to the special session.


コメント
この記事をはてなブックマークに追加

京都大学数理解析研究所(RIMS) 研究集会 「最適化の基礎理論と応用」

2013年05月28日 02時11分30秒 | Weblog
大変暑い時期ですが、以下の研究集会が RIMS で開催されます。

夏の京都での恒例行事となりました最適化関連の RIMS 研究集会を,
今年は8月末に開催いたします.最適化にご興味をお持ちの皆様,
ぜひご参加・ご発表くださいますようご案内申しあげます.

研究集会「最適化の基礎理論と応用」
http://www.tuat.ac.jp/~miya/RIMS2013/index.html

期間:2013年8月29日(木)~30日(金)
会場:京都大学数理解析研究所111号室
コメント
この記事をはてなブックマークに追加

parascip のバイナリ作成

2013年05月27日 02時46分44秒 | Weblog
SCIP ソルバーの 3.0.1 がリリースされているので、ダウンロードして parascip のバイナリ作成を行った。
以下の例では CPLEX 12.5.0.0 や UG 0.7.1 などのライブラリを用いている。実行の際には 192 プロセス(16ノード x 12 スレッド)を作成して並列計算を行っている。

◯ parascip の実行
mpiexec -machinefile /home/fujisawa/mpd.hosts.12 -n 192 ../bin/parascip ../settings/parascip.set ~/mps/mod011.mps -q
SCIP version 3.0.1 [precision: 8 byte] [memory: block] [mode: optimized] [LP solver: CPLEX 12.5.0.0] [GitHash: 9ee94b7]
Copyright (c) 2002-2013 Konrad-Zuse-Zentrum fuer Informationstechnik Berlin (ZIB)
External codes:
Readline 5.1 GNU library for command line editing (gnu.org/s/readline)
CPLEX 12.5.0.0 Linear Programming Solver developed by IBM (www.cplex.com)
cppad-20120101.3 Algorithmic Differentiation of C++ algorithms developed by B. Bell (www.coin-or.org/CppAD)
ZLIB 1.2.3 General purpose compression library by J. Gailly and M. Adler (zlib.net)
Default LC presolving (default).
Original Problem :
Problem name : mod011
Variables : 10958 (96 binary, 0 integer, 0 implicit integer, 10862 continuous)
Constraints : 4480
Objective sense : minimize
Presolved Problem :
Variables : 6495 (96 binary, 0 integer, 0 implicit integer, 6399 continuous)
Constraints : 1955
Constraints : Number
integral : 0
pseudoboolean : 0
soc : 0
SOS1 : 0
SOS2 : 0
varbound : 0
knapsack : 0
setppc : 0
linking : 0
or : 0
and : 0
xor : 0
conjunction : 0
disjunction : 0
linear : 1955
indicator : 0
orbitope : 0
logicor : 0
bounddisjunction : 0
cumulative : 0
abspower : 0
bivariate : 0
quadratic : 0
nonlinear : 0
superindicator : 0
countsols : 0
コメント
この記事をはてなブックマークに追加

TSUBAME グランドチャレンジ大規模計算制度

2013年05月26日 09時01分06秒 | Weblog
以下には2回採択されているが、応募数が少ないのであまり自慢にならないところがある。反対に言えば挑戦するにはそれだけ難しい制度ということでもある。

TSUBAME グランドチャレンジ大規模計算制度

TSUBAME グランドチャレンジ大規模計算制度では、学術分野においてTSUBAME2.0のピーク性能(2.4 PFLOPS)を生かして初めて可能となる挑戦的な大規模計算の研究課題(例えば、SC(Super Computing)のGordon Bell賞を目指すような研究)を広く公募し、TSUBAME2.0の全ノード占有利用環境を提供することで、世界のトップクラスのスパコンでしか達成できない著しい成果を上げることを目的としております。

コメント
この記事をはてなブックマークに追加

半正定値計画とロバスト制御

2013年05月25日 01時00分07秒 | Weblog
"第2回 数学・数理科学とシステム制御との連携研究集会『半正定値計画とロバスト制御』"

を開催します.

開催期間 2013年6月3日 (月)
開催場所 九州大学 伊都キャンパス 数理学研究教育棟 3F 中セミナー室7

講演プログラム
13:20-14:05 増淵 泉 (神戸大学) ロバストSDP の上界緩和問題とその厳密性
14:05-14:50 脇 隼人 (九大IMI) 多項式行列不等式系に対する半正定値計画緩和について
15:05-15:50 原 辰次 (東京大学) 一般化KYP補題とその展開
15:50-16:35 白井 朋之 (九大IMI) α-行列式の正値性---SDPの視点から---
16:35-17:00 全体討論

研究集会の詳細は,
http://www.imi.kyushu-u.ac.jp/events/view/1109
に記載しております.
コメント
この記事をはてなブックマークに追加

平成25年度JST CREST ・さきがけ

2013年05月24日 00時17分36秒 | Weblog
科学技術振興機構(JST)戦略的創造研究推進事業
 CREST  (6月13日正午〆切)
 さきがけ(6月11日正午〆切)
の公募締切まで残り3週間程度となりました。
http://www.senryaku.jst.go.jp/teian.html

各領域の説明会の様子・資料がアップされておりますので、
ぜひご参照ください。
http://www.senryaku.jst.go.jp/teian/top/setsumeikai.html
コメント
この記事をはてなブックマークに追加

最適化ワークショップ 整数計画法の発展と応用:2日目開催中

2013年05月23日 10時18分20秒 | Weblog
最適化ワークショップ 整数計画法の発展と応用:2日目開催中です。

6月2日に第2回 数学・数理科学とシステム制御との連携研究集会『半正定値計画とロバスト制御』が開催されます
http://www.imi.kyushu-u.ac.jp/events/view/1109

---------------------------------------------------------------------------------------------------------------
最適化ワークショップ 整数計画法の発展と応用

◯開催日時
2013-05-22 ~ 2013-05-23

◯開催場所
九州大学 伊都キャンパス 数理学研究教育棟 3階大講義室1

◯目的
研究/産業活動における整数計画法の事例を学ぶことで, 整数計画法の利用者を増やし整数計画法の理論や実用の発展につなげる
さまざまな分野からの整数計画法の事例を学ぶ事により, 新しい事例への応用や, 既存研究に関する議論を行う(特に, 最適化以外の分野への応用に関する発表を歓迎する)
整数計画法のチュートリアル講演を通して, 整数計画法を実際に使う際のテクニックや, ソルバーの現状を理解する
整数計画法に対する大規模並列計算とソフトウェアの講演を行い, 整数計画法に対するソフトウェアや大規模計算の現状を理解する
コメント
この記事をはてなブックマークに追加

GTC Japan 2013

2013年05月22日 01時32分11秒 | Weblog
今年もあります GTC Japan。私達も参加予定です。

イベント名:GTC Japan 2013

主催:エヌビディア ジャパン

共催:東京工業大学 GPUコンピューティング研究会

日時:2013年7月30日(火) 10:00 ~ 20:30

場所:東京ミッドタウンホール&カンファレンス(東京・六本木)

参加費:無料(事前登録制)

登録:http://www.gputechconf.jp
コメント
この記事をはてなブックマークに追加

GPU の数と SDPARA の性能

2013年05月21日 00時28分04秒 | Weblog
やはり 1ノードで 4GPUは、PCI-Express のバンド幅の制限であまり性能が出ない(4 ノード x 4GPU)。1ノードで 3GPU が一番性能が高いことが多い(以下の例など)。

◯問題:tai26a.dat-s
◯ソフトウェア SDPARA 7.6.0-G

1: 8GPU (4 x 2)
[gpdpotrf] ### END n=211926, nb=1024 took 1353.257246sec --> 2344.504699GFlops ###
2: 12GPU (4 x 3)
[gpdpotrf] ### END n=211926, nb=1024 took 880.964587sec --> 3601.413744GFlops ###
3: 16GPU (4 x 4)
[gpdpotrf] ### END n=211926, nb=1024 took 1174.209727sec --> 2702.002801GFlops ###

◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64

コメント
この記事をはてなブックマークに追加

JST CREST & ERATO 共催講演会 その2

2013年05月20日 01時12分18秒 | Weblog
この度 JST CREST ポストペタスケールシステムにおける超大規模グラフ最適化基盤と
JST ERATO 河原林巨大グラフプロジェクトとの共催で以下の講演会を行うことになりました。

事前登録等は不要ですので、是非ご参加下さい。

日時:2013年5月25日(土):15時から17時
場所:中央大学後楽園キャンパス6号館3階6301室

1: Laszlo Ladanyi (Software R&D at CPLEX, IBM Research, USA)

Title:
CPLEX remote object for distributed parallel optimization

Abstract:
In version 12.5.0 CPLEX has introduced the concept of remote objects
that greatly ease development of distributed parallel applications of
CPLEX optimizers. Remote objects enable the user to create cplex
environments on remote computers and afterwards treat them just as if
they were local environments. In this talk we will describe remote
objects in detail, demonstrate how to use them, and provide some
computational results on real world examples.


2: Hayato Waki (IMI, Kyushu University)

Title:
A perturbed sums of squares theorem for polynomial optimization and
its applications

Abstract:
We prove a property of positive polynomials on a compact set with a
small perturbation. When applied to a Polynomial Optimization Problem
(POP), the property implies that the optimal value of the
corresponding Semi Definite Programming (SDP) relaxation with
sufficiently large relaxation order is bounded from below by
$(f^*-\epsilon)$ and from above by $f^*+\epsilon(n+1)$, where $f^*$ is
the optimal value of the POP. We propose new SDP relaxations for POP
based on modifications of existing sums-of-squares representation
theorems. An advantage of our SDP relaxations is that they are of
considerably smaller dimension than those originally proposed by
Lasserre. We present some applications and the results of our
computational experiments. This is the joint work with Masakazu
Muramatsu and Levent Tuncel.
コメント
この記事をはてなブックマークに追加

OFED 3.5 その2

2013年05月19日 02時52分07秒 | Weblog
http://comments.gmane.org/gmane.network.openfabrics.enterprise/5829

We are working to do a point release (OFED 3.5.1) which will include RHEL
6.4. The ETA is in the next few weeks after we have tested the build.

◯OEFD 3.5 自体は CentOS 6.4.に未対応で、3.5.1 で対応するようです。ただし、3.5.1 はいまだにリリースされていません。
 また 1.5.4.1 は以下のように CentOS 6.4 に対応済み。

OFED 1.5.4.1 source rpm with RHEL 6.4 support available

I have patched the ofa_kernel source rpm from OFED 1.5.4.1 to work with
the RHEL/CentOS 6.4 kernel. Here is a link to the source rpm I created:

ftp://ftp.microway.com/for-customer/ofa_kernel-1.5.4.1.1-2.src.rpm
コメント
この記事をはてなブックマークに追加

OFED 3.5

2013年05月18日 03時18分11秒 | Weblog
OFED の Infiniband のドライバ等が更新されてバージョンが 3.5 になっている。

CentOS 6 では、何故だか上手く動作しない。原因は現時点では不明。。。
コメント
この記事をはてなブックマークに追加

第10回戦略的高性能計算システム開発に関するワークショップ

2013年05月17日 00時30分56秒 | Weblog
第10回戦略的高性能計算システム開発に関するワークショップ
日時:2013年7月30日(火) 9:00~17:30 (予定)
会場:北九州国際会議場
   http://www.convention-a.jp/

趣旨:
2010年より、今後の高性能並列計算機システムの開発戦略を議論していくことを目的に
ワークショップを開催し、大規模並列計算とそのための高性能並列計算機について主に
議論してきました。第10回を迎える本ワークショップでは、データ・インテンシブサイ
エンスに実際に取り組まれている研究者をお招きし講演を頂き、ビッグデータの視点か
ら今後の高性能並列計算機システム開発向けた議論の場を作ります。
また、2ヶ年目に入った文部科学省「将来のHPCIシステムに関する調査研究」の各採択
チームの調査研究の状況について報告して頂き、今後の高性能計算システム開発につい
て議論をするとともに「ミニアプリセッション -ミニアプリをどう作る、どう使う、
どう育てる?-」と銘打って、エクサスケールシステム開発において重要なツールとな
るミニアプリに関する情報共有の場を提供します。

プログラム(案):
 09:00~09:30 受付
 09:30~09:35 Opening
 09:35~11:20 Big Data and Extreme Computing
   09:35~09:40 BDECワークショップの概要 石川 裕(東京大学)
   09:40~10:30 招待講演 TBD
   10:30~11:20 招待講演 TBD
 11:20~12:40 LUNCH
 12:40~16:00 「文部科学省 将来のHPCIシステムに関する調査研究」報告
   12:40~13:25 システムチーム1
   13:25~14:10 システムチーム2
   14:10~14:55 システムチーム3
   14:55~15:15 BREAK
   15:15~16:00 アプリケーションチーム
 16:00~17:25 ミニアプリセッション
        -ミニアプリをどう作る、どう使う、どう育てる?-
 17:25~17:30 Closing
 18:00~20:00 懇親会
コメント
この記事をはてなブックマークに追加