最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

RAMP シンポジウム終了

2013年10月31日 01時02分37秒 | Weblog
RAMP シンポジウムが終わって、鹿児島から福岡に移動しました。
新幹線みずほに乗ったら 288.9km をたったの 77分で移動。平均速度 225km/h。
来年の RAMP は法政大学(東京)の予定です。時期は未定です。


コメント
この記事をはてなブックマークに追加

Intel Compiler 14.0.1登場

2013年10月30日 01時10分40秒 | Weblog
Intel Compiler 14.0.1がリリースされました。非商用版については以下のリンクから入手可能です。

Non-Commercial Software Development

Product Suites

Intel® Parallel Studio XE 2013 for Linux*
Includes Intel® C++ Composer XE 2013, Intel® Fortran Composer XE 2013, Intel® VTune™ Amplifier XE 2013, Intel® Inspector XE 2013
Intel® C++ Studio XE 2013 for Linux
Includes Intel® C++ Composer XE 2013, Intel® VTune™ Amplifier XE 2013, Intel® Inspector XE 2013
Compilers and Libraries

Intel® Fortran Composer XE 2013 for Linux
Includes Intel® Fortran Compiler, Intel® Math Kernel Library 11.0
Intel® C++ Composer XE 2013 for Linux
Includes Intel® C++ Compiler, Intel® Integrated Performance Primitives 7.1, Intel® Math Kernel Library 11.0,
Intel Cilk™ Plus, the Intel® Threading Building Blocks (Intel® TBB)”
コメント
この記事をはてなブックマークに追加

Generated by YALMIP その14

2013年10月29日 03時01分31秒 | Weblog
ずーとこのネタを引っ張っていましたが、140問を全て解き終わりました。実際に解いたのは計算機ですが、結構手間暇かかりました。

◯終了状態:pdOPT 139問, pdFEAS 1問(十分精度は高い)
◯開始日時:2013年8月21日 3時21分
◯終了日時:2013年10月27日 18時38分
◯殉職者:NVIDIA Tesla C2070 1枚 (交換予定)



◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

第25回 RAMPシンポジウム まもなく開催

2013年10月28日 02時58分58秒 | Weblog
いよいよ29日から今年度の RAMP シンポジウムが開催されます。私の RAMP 研究会の幹事の任期もこの RAMP シンポジウムをもって終了します。でもまだまだ残りの仕事は多いです。

第25回 RAMPシンポジウム ホームページ
日時 : 2013年10月29日(火),30日(水)
会場 : 鹿児島大学稲盛会館
コメント
この記事をはてなブックマークに追加

SC13 JST ブースでの研究展示用パネル

2013年10月27日 03時00分21秒 | Weblog
今年から JST CREST ポストペタ領域国際会議 SC13 において展示ブースを設置して、研究展示やソフトウェアデモを行うことになりました。以下が当 CREST チームの展示用ポスターファイルです。

SC13 JST ブースでの研究展示用パネル

コメント
この記事をはてなブックマークに追加

Math-for-Industry"2013 -The Impact of Applications on Mathematics

2013年10月26日 02時08分33秒 | Weblog
以下の研究フォーラムが開催されます。私自身は授業等のため参加できません。

Forum "Math-for-Industry" 2013
-The Impact of Applications on Mathematics-
   http://fmi2013.imi.kyushu-u.ac.jp/
 日 時  2013年11月4日(月) ~ 11月8日(金)
 場 所  九州大学西新プラザ
(http://www.kyushu-u.ac.jp/university/institution-use/nishijin/infomap.htm)

参加費  1,000円(学生 無料)
懇親会  11月6日(水)18:30より 参加費 6,000円(学生 3,000円)
主 催   九州大学 マス・フォア・インダストリ研究所
コメント
この記事をはてなブックマークに追加

移動用サーバ その3

2013年10月25日 01時44分15秒 | Weblog
移動用サーバをとりあえず列挙してみました。

種類   数 高さ 幅  奥行  最大電力使用量 通常利用時の電力使用量(最大時に対する割合)
サーバ1 4台 18cm 44cm 70cm 1400w(700w×2)  40~70%
サーバ2 2台 18cm 44cm 76cm 1620w(810w×2)  30~60%
サーバ3 2台 18cm 44cm 66cm 865w(single)    40~60%
サーバ4 1台 18cm 44cm 76cm 1050w(525w×2)   30~60%
サーバ5 3台 18cm 44cm 76cm 1400w(700w×2)  40~70%





コメント
この記事をはてなブックマークに追加

Generated by YALMIP その13

2013年10月24日 01時32分06秒 | Weblog
131問が終了して、残り9問となりました。現在は3ノードで計算中ですので、1問につき11~12時間程かかります。大きなトラブルが無ければ1週間以内に終了すると思います。



◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

移動用サーバ その2

2013年10月23日 02時37分21秒 | Weblog
移動なんて言ってましたら、エアコン2台のうち1台が故障してしまいした(室外機のトラブルらしいです)。1台だけでは冷却能力は十分ではありませんので、

このブレードサーバは全部止めました。


こちらのラックマウントサーバを必要最小限のサーバだけ残して止めました。


これらは全部動いています。

コメント
この記事をはてなブックマークに追加

移動用サーバ

2013年10月22日 00時27分41秒 | Weblog
来年度、移動して一緒に持っていけそうなサーバは以下の静音ラックの中に入っているサーバくらい。静音ラック自体も持って行けないが、残りの50台くらいのサーバはほとんど廃棄か?





コメント
この記事をはてなブックマークに追加

Generated by YALMIP その12

2013年10月21日 02時20分04秒 | Weblog
昨日を書きましたように以下のクラスタの1台が不調となったので(GPU の故障)、3台のみで計算を行ってます。4台の時と3台の時の性能差は以下の通りです。

◯4台 (4ノード x 4 GPU(NVIDIA Tesla C2075) = 16GPU)
79 1.4e-10 5.8e-17 1.3e-11 -9.45e+03 -9.45e+03 9.1e-01 8.4e-01 1.00e-01

phase.value = pdOPT
Iteration = 79
mu = +1.4034852840759202e-10
relative gap = +8.3174063453300135e-09
gap = +7.8613695222884417e-05
digits = +8.0800120806226960e+00
objValPrimal = -9.4517078560304726e+03
objValDual = -9.4517079346441678e+03
p.feas.error = +5.7731597280508140e-15
d.feas.error = +6.8752492587975667e-10
total time = 32756.584331

◯3台 (3ノード x 4 GPU(NVIDIA Tesla C2075) = 16GPU)
79 1.6e-10 4.9e-17 1.7e-11 -1.36e+04 -1.36e+04 9.0e-01 7.3e-01 1.00e-01

phase.value = pdOPT
Iteration = 79
mu = +1.5720273815170017e-10
relative gap = +6.4838996714514351e-09
gap = +8.8068376498995349e-05
digits = +8.1881637138223073e+00
objValPrimal = -1.3582624759177957e+04
objValDual = -1.3582624847246334e+04
p.feas.error = +4.8849813083506888e-15
d.feas.error = +1.3258105724389679e-09
total time = 43119.183775




◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

Generated by YALMIP その11

2013年10月20日 03時47分34秒 | Weblog
残り18問(全部で140問)まで来て、以下のクラスタの1台が不調となったので(GPU の故障)、3台のみで計算を行ってます。というわけなので当初より終了が遅れます。



◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

Peta-scale General Solver for Semidefinite Programming Problems with over Two Million Constraints

2013年10月19日 00時32分08秒 | Weblog
Title:
Peta-scale General Solver for Semidefinite Programming Problems with over Two Million Constraints

Abstract:
The semidefinite programming (SDP) problem is one of the most central problems in mathematical optimization. The primal-dual interior-point method (PDIPM) is one of
the most powerful algorithms for solving SDP problems, and many research groups have employed it for developing software packages. However, two well-known major bottleneck parts i.e., the generation of the Schur complement matrix (SCM) and its Cholesky factorization, exist in the algorithmic framework of PDIPM.
We have developed a new version of SDPARA, which is a parallel implementation on multiples CPUs and GPUs for solving extremely large-scale SDP problems with over a million constraints. SDPARA can automatically extract the unique characteristics from an SDP problem and identify the bottleneck. When the generation of SCM becomes a
bottleneck part, SDPARA can attain high scalability using a large quantity of CPU cores and some techniques of processor affinity and memory interleaving. SDPARA can also perform parallel Cholesky factorization using thousands of GPUs and techniques to overlap computation and communication if an SDP problem has over two million constraints and Cholesky factorization constitutes a bottleneck part.We demonstrate that SDPARA is a high-performance general solver for SDPs in various application fields through numerical experiments at the TSUBAME 2.5 supercomputer, and we solved the largest SDP problem (which has over 2.33 million constraints), thereby creating a new world record. Our implementation also achieved 1.713 PFlops in double precision for large-scale Cholesky factorization using 2,720 CPUs and 4,080 GPUs.
コメント
この記事をはてなブックマークに追加

Windows 8.1リリース

2013年10月18日 02時34分20秒 | Weblog
Windows 8 のマシンと言っても、Panasonic Let's note 1台しか持っていないのですが、8.1 に上げるかどうかについてはしばらく様子見です。Linux 等でしたら即日アップデートしますが、Windows に関しては過去にいろいろと懲りているので慎重です。

Windows 8.1リリース開始 - Windows 8ユーザーはストア経由でアップデート可能に
10月17日20時(太平洋時間では18日午前4時)、Microsoftは予定どおりWindows 8.1を一般公開した。現在Windows 8を利用中のユーザーは、Windowsストアからアップデートファイルを入手し、無償でWindows 8.1へ(Windows 8 ProユーザーはWindows 8.1 Proへ)アップデートできる。
コメント
この記事をはてなブックマークに追加

もうすぐサポート終了

2013年10月17日 02時10分11秒 | Weblog
OPT クラスタはそろそろ購入から3年経ちますので、メーカのサポート終了となります。というわけですので、このクラスタ計算機は今年度末で停止させる予定です。



◯ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.9 for x86_64
コメント
この記事をはてなブックマークに追加