最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

ScaleGraph 2.0b

2013年08月31日 01時03分45秒 | Weblog
我々の CREST プロジェクトで ScaleGraph の開発を行っております。X10 ベースの並列グラフライブラリです。

最新版の ScaleGraph 2.0b がすでにリリースされています。近日中に講習会等も開催されます。


コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

イノベーション・ジャパン2013 ~大学見本市&ビジネスマッチング~ 30日まで

2013年08月30日 00時00分53秒 | Weblog
29日は多くの方に研究展示ブースを訪問していただきまして大変ありがとうございます。場所が良かったこともありますが、前回の参加よりも訪問者の数が増えています。当CRESTチームで明日も(30日)研究展示等を行います:次世代スパコン上での大規模グラフデータ解析システム

【イノベーション・ジャパン2013 ~大学見本市&ビジネスマッチング~ 開催概要】

名  称:イノベーション・ジャパン2013 ~大学見本市&ビジネスマッチング~
会  期:2013年8月29日(木)~30日(金)
開催時間:8/29(木) 9:30~17:30、8/30(金)10:00~17:00
会  場:東京ビッグサイト(東京国際展示場)
     http://innovation-japan2013.jp/access.html
主  催:科学技術振興機構(JST)、新エネルギー・産業技術総合開発機構(NEDO)
共  催:文部科学省、経済産業省、内閣府
特別協賛:野村證券
入 場 料:無料
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

イノベーション・ジャパン2013 ~大学見本市&ビジネスマッチング~ 明日から

2013年08月29日 01時45分57秒 | Weblog
当CRESTチームで明日から(29、30日)研究展示等を行います:次世代スパコン上での大規模グラフデータ解析システム

【イノベーション・ジャパン2013 ~大学見本市&ビジネスマッチング~ 開催概要】

名  称:イノベーション・ジャパン2013 ~大学見本市&ビジネスマッチング~
会  期:2013年8月29日(木)~30日(金)
開催時間:8/29(木) 9:30~17:30、8/30(金)10:00~17:00
会  場:東京ビッグサイト(東京国際展示場)
     http://innovation-japan2013.jp/access.html
主  催:科学技術振興機構(JST)、新エネルギー・産業技術総合開発機構(NEDO)
共  催:文部科学省、経済産業省、内閣府
特別協賛:野村證券
入 場 料:無料
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最速フローアルゴリズムによる避難シミュレーション

2013年08月28日 01時19分15秒 | Weblog
大阪市湾岸部の津波による避難シミュレーション:避難者数:189,248 人。



最速フローアルゴリズムによる避難完了時間の計算。50%の避難完了は 400秒。最後の5%の避難完了のために全体の半分近い時間がかかる。



コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

nvidia-smi と GeForce GTX Titan

2013年08月27日 01時13分28秒 | Weblog
NVIDIA の最新のドライバ 319.49(2013年8月20日)版でも GeForce GTX Titan に正式対応していないようです。。。ただし普通に動作はします。



# nvidia-smi
Tue Aug 27 01:09:17 2013
+------------------------------------------------------+
| NVIDIA-SMI 5.319.49 Driver Version: 319.49 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX TITAN Off | 0000:01:00.0 N/A | N/A |
| 30% 33C N/A N/A / N/A | 68MB / 6143MB | N/A Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX TITAN Off | 0000:02:00.0 N/A | N/A |
| 30% 34C N/A N/A / N/A | 14MB / 6143MB | N/A Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0 Not Supported |
| 1 Not Supported |
+-----------------------------------------------------------------------------+
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Generated by YALMIP その3

2013年08月26日 00時51分40秒 | Weblog
引き続いて以下の大きな SDP をたくさん解いていますが、Cholesky 分解部分では 16GPU(NVIDIA Tesla C2075) で 2511GFlops という性能になっています。

140185 = mDIM
2 = nBLOCK
-559682 530 = bLOCKsTRUCT

[gpdpotrf] ### END n=140185, nb=1024 took 365.607065sec --> 2511.706004GFlops ###

◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

スーパーコンピュータ「京」を知る集い

2013年08月25日 21時59分52秒 | Weblog
参加してきました。中高生は残念ながらほとんど見かけませんでした。

スーパーコンピュータ「京」を知る集い


日時
2013/08/24 (土) 14:00 ~ 17:00 東京
場所
東京大学 伊藤謝恩ホール (地図)



スパコン「京」、抗がん剤候補物質を続々発見



コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GTC Japan 2013 のセッション資料

2013年08月24日 01時16分08秒 | Weblog
GTC Japan 2013のセッション資料が公開されました。

https://reg-nvidia.jp/cc/0mbIkP0xbQHbQ1


コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPA と OpenBLAS, Intel MKL, ATLAS の組み合わせ

2013年08月23日 01時16分30秒 | Weblog
SDPA と OpenBLAS, Intel MKL, ATLAS の組み合わせについての比較。性能差でははっきりと Intel MKL > OpenBLAS > ATLAS となっている。

◯ ソフトウェア SDPA 7.4.0

◯問題1:karate.dat-s
SDPA 7.4.0 + OpenBLAS 0.2.8 : 165.67s
SDPA 7.4.0 + Intel MKL 11.0.5 : 134.34s
SDPA 7.4.0 + ATLAS 3.11.12 : 254.53s

◯問題2:nug12_r2.dat-s
SDPA 7.4.0 + OpenBLAS 0.2.8 : 53.04s
SDPA 7.4.0 + Intel MKL 11.0.5 : 46.33s
SDPA 7.4.0 + ATLAS 3.11.12 : 96.90s

◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
SDPA 7.4.0 + OpenBLAS 0.2.8 : 108.15s
SDPA 7.4.0 + Intel MKL 11.0.5 : 97.15s
SDPA 7.4.0 + ATLAS 3.11.12 : 異常停止

◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4650 (8-core 2.47GHz 16MB cache) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.4
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

スモールワールド

2013年08月22日 13時50分33秒 | Weblog
以下のサイト”うぃきったー”ですが、実際には6回のリンクを辿るキーワードを見付けるのはそんなに簡単ではないです。
こんな何の関係も無さそうな2つのキーワードでも5経路で到達します。『電子励起爆薬』→『トリニトロトルエン』→『オクタニトロキュバン』→『1999年』→『郷ひろみ』→『高沢順子』 ちなみにこれは6経路です。『電子励起爆薬』→『TNT換算』→『1945年』→『大正』→『日本の歴史』→『院政期文化』→『かえる』

うぃきったー

Wikipediaは任意のページから6回リンクを巡ると、どんな記事ページにもいけるんだって!
みんなも一緒に実感してみよう!

Graph500 用に作成したプログラムを一般のグラフで幅優先探索できるように変えてみました。24億枝の twitter グラフで探索時間は 0.7秒です。6ホップ内で 99.97%。15ホップというユーザも2人います。実際には6リンク(ホップ)で到達できない記事ページもごく少数あると思います。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

IEEE BigData 2013 プログラム公開

2013年08月21日 02時25分24秒 | Weblog
IEEE BigData 2013プログラムが公開されました。9日には現地を出発しないといけないので、7日でよかった。。。

Keynote Lecture: 60 minutes((about 45 minutes for talk and 15 minutes for Q and A)
Invited Talk: 40 minutes (about 30 minutes for talk and 10 minutes for Q and A)
Main conference regular paper: 25 minutes (about 20 minutes for talk and 5 minutes for Q and A)
Main conference short paper: 20 minutes (about 16 minutes for talk and 4 minutes for Q and A)

◯Oct 7 09:45-12:00
Session AB1
Regular
BigD282 "NUMA-optimized Parallel Breadth-first Search on Multicore Single-node System"
Yuichiro Yasui, Katsuki Fujisawa, and Kazushige Goto
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Generated by YALMIP その2

2013年08月20日 01時20分28秒 | Weblog
140185 = mDIM
2 = nBLOCK
-559682 530 = bLOCKsTRUCT

某国の研究者から依頼された大きな SDP について。GPU 加速付きの SDPARA 7.6.0-G で解いてみました。
この規模の問題になると世界的にも他のグループでは解くことができないと思います。

SDPA start at [Sun Aug 18 19:17:14 2013]
param is ./param.sdpa
data is /home/fujisawa/data/20_test_input.dat-s : sparse
"OPTI SDP Problem [Sparse] generated on 12-Aug-2013 17:01:07"
out is out.20_test
NumNodes is set as 16
NumThreads is set as 3
Schur computation : DENSE
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 +0.00e+00 -5.61e+07 9.0e-01 1.0e+00 2.00e-01
1 1.5e+03 9.9e-02 1.5e-11 +3.39e+02 -7.73e+07 9.3e-01 9.3e-01 2.00e-01
2 2.8e+02 7.0e-03 1.9e-11 -1.15e+01 -9.20e+07 1.0e+00 1.2e+00 2.00e-01
3 5.5e+01 4.5e-18 1.8e-11 -1.64e+01 -3.11e+07 1.4e+00 9.2e-01 1.00e-01
4 9.7e+00 4.5e-18 6.4e-12 -7.63e+01 -5.43e+06 1.4e+00 8.0e-01 1.00e-01
5 2.7e+00 9.0e-18 1.4e-12 -1.82e+02 -1.50e+06 1.4e+00 8.0e-01 1.00e-01
6 7.4e-01 9.0e-18 3.7e-13 -5.70e+02 -4.18e+05 7.9e-01 8.0e-01 1.00e-01
7 2.1e-01 1.3e-17 1.0e-13 -1.37e+03 -1.17e+05 4.0e-01 6.1e-01 1.00e-01
8 9.4e-02 1.3e-17 4.5e-14 -2.58e+03 -5.55e+04 2.0e-01 3.2e-01 1.00e-01
9 6.8e-02 9.0e-18 2.3e-14 -3.33e+03 -4.14e+04 1.4e-01 3.6e-01 1.00e-01
10 4.7e-02 1.3e-17 1.7e-14 -3.77e+03 -3.01e+04 1.6e-01 3.8e-01 1.00e-01
11 3.2e-02 1.3e-17 1.3e-14 -4.25e+03 -2.23e+04 2.0e-01 3.3e-01 1.00e-01
12 2.3e-02 1.3e-17 7.5e-15 -4.83e+03 -1.78e+04 2.8e-01 3.3e-01 1.00e-01
13 1.7e-02 1.3e-17 6.0e-15 -5.53e+03 -1.48e+04 2.3e-01 2.8e-01 1.00e-01
14 1.3e-02 1.3e-17 7.8e-15 -5.97e+03 -1.30e+04 2.7e-01 2.9e-01 1.00e-01
15 9.4e-03 1.3e-17 6.3e-15 -6.42e+03 -1.17e+04 2.2e-01 8.3e-02 1.00e-01
16 8.4e-03 1.3e-17 5.9e-15 -6.70e+03 -1.14e+04 3.2e-01 2.4e-01 1.00e-01
17 6.4e-03 1.8e-17 1.1e-14 -7.05e+03 -1.06e+04 1.3e-01 1.5e-01 1.00e-01
18 5.5e-03 1.8e-17 1.3e-14 -7.16e+03 -1.03e+04 2.6e-01 2.0e-01 1.00e-01
19 4.5e-03 1.8e-17 2.0e-14 -7.37e+03 -9.87e+03 9.2e-02 2.0e-01 1.00e-01
20 3.8e-03 1.8e-17 1.8e-14 -7.43e+03 -9.55e+03 2.4e-01 2.3e-01 1.00e-01
21 3.0e-03 1.8e-17 3.7e-14 -7.59e+03 -9.26e+03 1.2e-01 1.4e-01 1.00e-01
22 2.6e-03 1.8e-17 3.1e-14 -7.66e+03 -9.13e+03 2.4e-01 1.9e-01 1.00e-01
23 2.1e-03 2.2e-17 4.8e-14 -7.79e+03 -8.98e+03 1.9e-01 1.7e-01 1.00e-01
24 1.8e-03 2.2e-17 6.0e-14 -7.87e+03 -8.87e+03 2.2e-01 1.9e-01 1.00e-01
25 1.5e-03 2.2e-17 6.0e-14 -7.95e+03 -8.77e+03 1.2e-01 1.7e-01 1.00e-01
26 1.3e-03 2.2e-17 5.3e-14 -7.98e+03 -8.69e+03 2.4e-01 1.9e-01 1.00e-01
27 1.0e-03 2.7e-17 5.8e-14 -8.05e+03 -8.63e+03 2.6e-01 1.5e-01 1.00e-01
28 8.4e-04 2.2e-17 5.1e-14 -8.11e+03 -8.58e+03 1.1e-01 1.1e-01 1.00e-01
29 7.6e-04 2.7e-17 5.1e-14 -8.13e+03 -8.55e+03 2.5e-01 2.3e-01 1.00e-01
30 5.9e-04 2.7e-17 5.3e-14 -8.17e+03 -8.50e+03 8.4e-02 8.5e-02 1.00e-01
31 5.5e-04 2.7e-17 5.5e-14 -8.18e+03 -8.49e+03 2.4e-01 2.0e-01 1.00e-01
32 4.4e-04 2.7e-17 8.1e-14 -8.21e+03 -8.45e+03 6.8e-02 3.9e-02 1.00e-01
33 4.2e-04 3.1e-17 7.7e-14 -8.21e+03 -8.45e+03 3.1e-01 2.2e-01 1.00e-01
34 3.2e-04 3.1e-17 6.2e-14 -8.24e+03 -8.42e+03 1.2e-01 6.6e-02 1.00e-01
35 3.0e-04 3.1e-17 5.5e-14 -8.25e+03 -8.42e+03 2.4e-01 1.2e-01 1.00e-01
36 2.5e-04 3.1e-17 5.4e-14 -8.26e+03 -8.41e+03 1.3e-01 1.5e-01 1.00e-01
37 2.2e-04 3.1e-17 6.4e-14 -8.27e+03 -8.39e+03 2.2e-01 2.1e-01 1.00e-01
38 1.8e-04 3.1e-17 9.5e-14 -8.28e+03 -8.38e+03 7.6e-02 6.9e-02 1.00e-01
39 1.7e-04 3.1e-17 9.8e-14 -8.28e+03 -8.37e+03 1.8e-01 3.5e-01 1.00e-01
40 1.2e-04 3.1e-17 1.4e-13 -8.29e+03 -8.36e+03 2.0e-01 2.0e-01 1.00e-01
41 1.0e-04 3.6e-17 2.3e-13 -8.29e+03 -8.35e+03 3.0e-01 4.0e-01 1.00e-01
42 6.9e-05 3.6e-17 2.0e-13 -8.30e+03 -8.34e+03 3.8e-01 3.3e-01 1.00e-01
43 4.7e-05 3.6e-17 2.6e-13 -8.31e+03 -8.33e+03 1.8e-01 9.8e-02 1.00e-01
44 4.1e-05 4.0e-17 2.2e-13 -8.31e+03 -8.33e+03 2.7e-01 2.5e-01 1.00e-01
45 3.1e-05 3.6e-17 2.1e-13 -8.31e+03 -8.33e+03 1.8e-01 8.6e-02 1.00e-01
46 2.8e-05 3.6e-17 2.1e-13 -8.31e+03 -8.33e+03 5.0e-01 3.0e-01 1.00e-01
47 1.8e-05 4.0e-17 2.4e-13 -8.32e+03 -8.33e+03 3.9e-01 2.3e-01 1.00e-01
48 1.3e-05 4.0e-17 2.1e-13 -8.32e+03 -8.33e+03 5.3e-01 6.4e-01 1.00e-01
49 5.9e-06 3.6e-17 3.6e-13 -8.32e+03 -8.32e+03 5.9e-01 7.6e-01 1.00e-01
50 2.3e-06 4.0e-17 4.9e-13 -8.32e+03 -8.32e+03 6.6e-01 8.8e-01 1.00e-01
51 7.8e-07 4.0e-17 6.0e-13 -8.32e+03 -8.32e+03 8.0e-01 8.8e-01 1.00e-01
52 2.1e-07 4.0e-17 1.1e-12 -8.32e+03 -8.32e+03 8.1e-01 8.8e-01 1.00e-01
53 5.4e-08 4.0e-17 5.8e-12 -8.32e+03 -8.32e+03 8.6e-01 8.8e-01 1.00e-01
54 1.2e-08 4.0e-17 7.0e-12 -8.32e+03 -8.32e+03 8.7e-01 8.8e-01 1.00e-01
55 2.6e-09 4.0e-17 1.8e-12 -8.32e+03 -8.32e+03 8.9e-01 9.1e-01 1.00e-01
56 5.2e-10 4.0e-17 1.8e-12 -8.32e+03 -8.32e+03 8.9e-01 9.1e-01 1.00e-01

phase.value = pdOPT
Iteration = 56
mu = +5.1816898913874816e-10
relative gap = +3.4883991269231272e-08
gap = +2.9027855089225341e-04
digits = +7.4573738308771986e+00
objValPrimal = -8.3212538264006089e+03
objValDual = -8.3212541166791598e+03
p.feas.error = +3.9968028886505635e-15
d.feas.error = +7.4954265016913268e-11
total time = 26928.363373


◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本オペレーションズ・リサーチ学会 2013年秋季研究発表会 プログラム公開中

2013年08月19日 00時30分14秒 | Weblog
日本オペレーションズ・リサーチ学会 2013年秋季研究発表会のプログラムが公開されています。今回は特別講演をさせていただく予定ですが、2ページの予稿も作成して提出しました。

テーマ
ツーリズムとOR

日程
2013年9月11日(水), 12日(木)

会場
徳島大学 常三島キャンパス 総合科学部1号館
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Fedora 19 上での VMware Player

2013年08月18日 22時34分04秒 | Weblog
Fedora 19 上での VMware Player 5.0.2 の起動が出来ない状態だったが、以下のページの通りに行うことによって無事に起動することができた。

Fedora 19 with kernel 3.10 fail to install vmplayer module.

# tar xf /usr/lib/vmware/modules/source/vmnet.tar
# cd vmnet-only
# wget http://communities.vmware.com/servlet/JiveServlet/download/2239207-108590/procfs.patch
# patch -p1 < procfs.patch
# cd ..
# tar -cvf vmnet.tar vmnet-only/
# cp vmnet.tar /usr/lib/vmware/modules/source/

# tar xf /usr/lib/vmware/modules/source/vmblock.tar
# cd vmblock-only
# wget https://sites.google.com/site/mysticalzerotmp/vmblock.3.10.patch
# patch -p1 < vmblock.3.10.patch
# cd ..
# tar -cvf vmblock.tar vmblock-only/
# cp vmblock.tar /usr/lib/vmware/modules/source/

# sudo vmware-modconfig --console --install-all
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPA 分析結果

2013年08月17日 00時25分18秒 | Weblog
某分析ツールによる SDPA の分析結果について。これらの分析結果のデータを得るためにはかなりの時間がかかります。

◯ 問題 theta6.dat-s


◯ 問題 mcp124-1.dat-s

小さくて見づらいので原図と同じサイズの png ファイル
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする