最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Fedora 17 から 18 への upgrade

2013年01月31日 02時44分52秒 | Weblog
まずは rpm ファイルの入手

$ yum -y install fedup
$ yum clean all
$ fedup-cli --network 18 --debuglog fedupdebug.log

ここで再起動をかけると再起動後に自動的に upgrade が始まる。あとは待っていれば良い。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

勉強しよう

2013年01月30日 00時56分15秒 | Weblog
毎年試験の時期になると以下のように解答のファイルを求めて、Web サーバ宛にいろいろな名前を入力している人を見かけるが、こんなことをしていないで真面目に勉強しよう。解答ファイルをこんなところに置くことはありません。

softbank219016052008.bbtec.net - - [29/Jan/2013:08:44:51 +0900] "GET /~fujisawa/lecture/test-answer.pdf HTTP/1.1" 404 231 "http://sdpa.indsys.chuo-u.ac.jp/~fujisawa/lecture/index6f.html" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)"
softbank219016052008.bbtec.net - - [29/Jan/2013:08:45:07 +0900] "GET /~fujisawa/lecture/test.html HTTP/1.1" 404 225 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)"
softbank219016052008.bbtec.net - - [29/Jan/2013:08:45:18 +0900] "GET /~fujisawa/lecture/test-answer.html HTTP/1.1" 404 232 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)"
softbank219016052008.bbtec.net - - [29/Jan/2013:08:45:28 +0900] "GET /~fujisawa/lecture/test_answer.html HTTP/1.1" 404 232 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)"
softbank219016052008.bbtec.net - - [29/Jan/2013:08:45:39 +0900] "GET /~fujisawa/lecture/2012-test.html HTTP/1.1" 404 230 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)"
softbank219016052008.bbtec.net - - [29/Jan/2013:08:45:47 +0900] "GET /~fujisawa/lecture/test7f.html HTTP/1.1" 404 227 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)"
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Intel コンパイラ -xHost オプション その2

2013年01月29日 01時21分03秒 | Weblog
昨日と同じ実験(-xHost)を SDPARA を用いて行った。-xHost を付けてもあまりメリットが見られないようだ。

◯ ソフトウェア SDPARA 7.5.0

◯問題1:NH3+.2A2".STO6G.pqgt1t2p.dat-s
icc -funroll-all-loops -O2 : 165.61s
icc -funroll-all-loops -O2 -xHost : 170.35s

◯問題2:Be.1S.SV.pqgt1t2p.dat-s
icc -funroll-all-loops -O2 : 639.66s
icc -funroll-all-loops -O2 -xHost : 673.59s

◯問題3:tai14a.dat-s
icc -funroll-all-loops -O2 : 424.43s
icc -funroll-all-loops -O2 -xHost : 462.94s


◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Intel コンパイラ -xHost オプション

2013年01月28日 00時02分19秒 | Weblog
インテルコンパイラ(icc)には以下のように -xHost というオプションがある。

-xHost : Tells the compiler to generate instructions for the highest instruction set available on the compilation host processor.

これを用いて以下のように gcc と icc の比較実験を行った。-xHost が良いとも簡単には言えない。

◯ ソフトウェア SDPA 7.4.0

◯問題1:karate.dat-s
gcc -funroll-all-loops -O2 : 190.21s
icc -funroll-all-loops -O2 : 183.36s
icc -funroll-all-loops -O2 -xHost : 219.03s

◯問題2:nug12_r2.dat-s
gcc -funroll-all-loops -O2 : 64.11s
icc -funroll-all-loops -O2 : 72.24s
icc -funroll-all-loops -O2 -xHost : 70.78s

◯問題3:FH2+.1A1.STO6G.pqgt1t2p.dat-s
gcc -funroll-all-loops -O2 : 36.53s
icc -funroll-all-loops -O2 : 37.00s
icc -funroll-all-loops -O2 -xHost : 36.51s

◯問題4:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc -funroll-all-loops -O2 : 137.22s
icc -funroll-all-loops -O2 : 137.79s
icc -funroll-all-loops -O2 -xHost : 142.26s

◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Wolfram Alpha

2013年01月27日 00時31分44秒 | Weblog
昨日の講演で紹介していただいた Wolfram Alpha のページ

Wolfram Alpha

○例えば factorize x^4-1 と入れると

(x-1)(x+1)(x^2+1)

などと出力される。

○また Dou you know the largest prime number less than 100000? こんな風に入力すると

NextPrime[100,000,-1] となって 99,991 と表示される


コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Semidefinite programming for optimal power flow problems

2013年01月26日 01時23分18秒 | Weblog
以下の論文が最近一部の分野(制御等)で少し話題になっているので、ここで紹介する。

Semidefinite programming for optimal power flow problems
Xiaoqing Bai*, Hua Wei, Katsuki Fujisawa, Yong Wang

Abstract
This paper presents a new solution using the semidefinite programming (SDP) technique to solve the optimal power flow problems
(OPF). The proposed method involves reformulating the OPF problems into a SDP model and developing an algorithm of interior point
method (IPM) for SDP. That is said, OPF in a nonlinear programming (NP) model, which is a nonconvex problem, has been accurately
transformed into a SDP model which is a convex problem. Based on SDP, the OPF problem can be solved by primal–dual interior point
algorithms which possess superlinear convergence. The proposed method has been tested with four kinds of objective functions of OPF.
Extensive numerical simulations on test systems with sizes ranging from 4 to 300 buses have shown that this method is promising for
OPF problems due to its robustness.

International Journal of Electrical Power & Energy Systems
Volume 30, Issues 6–7, July–September 2008, Pages 383–392
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本数式処理学会東北地区合同分科会

2013年01月25日 01時54分48秒 | Weblog
日本数式処理学会東北地区合同分科会開催のご案内

  2012年3月に開催された日本数式処理学会定期理事会第3号議案 において,「今後3年もしくは5年程度の期間学会の主催による研 究会を東北地域で開催する」ことが議決されました。これを受け て,東北地域の復興と会員および分科会相互の研究内容の理解など を目的として,東北地域において,日本数式処理学会のシステム・ 基礎理論・教育の3分科会による 合同研究会を下記のように開催致します。 皆様のご参加をお待ち申し上げます。

開催日 2013 年 1 月 26日(土) ~ 27日(日)
場所 仙台青葉カルチャーセンター 602号室
宮城県仙台市青葉区一番町2-3-10 カルチャー仙台ビル
http://www.culture.gr.jp/sendaiaoba/

招待講演
安井雄一郎(中央大学)
メモリ階層構造を考慮した大規模グラフ処理の高速化

藤澤克樹(中央大学)
大規模最適化問題に対するソフトウェア開発と高速&安定計算
           --理論からスパコンまで--

中田真秀(理化学研究所情報基盤センター)
高精度線形代数演算ライブラリMPACK 0.8.0の紹介
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

大きな SDP (Sparse Cholesky 分解) その2

2013年01月24日 01時42分39秒 | Weblog
前回の続きでスレッド数の変化による実行時間を測定してみた。現在でもいろいろ調べているので、また報告していく。

◯実行結果
2スレッド : 10331.28s
4スレッド : 8118.21s
8スレッド : 7402.06s
16スレッド : 7392.43s
32スレッド : 8437.92s

◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3

◯問題
* SDPA sparse format data
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
25724
37
-5460 -24289 363 323 323 323 323 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

JST ポストペタ CREST 研究:平成24年度

2013年01月23日 00時55分09秒 | Weblog
1:超大規模グラフ最適化システムにおける主要なコンポーネントのプロトタイプの開発
◯ X10 言語上の大規模グラフ処理ライブラリの設計・開発
◯ 大規模グラフストリーム処理系の設計・開発
◯ 大規模グラフ処理向けI/Oインターフェースの設計
◯ 大規模社会ネットワークの高速クラスタリング
2:超大規模データに対する大規模グラフ解析の確立に向けた研究の推進
◯ 時間的に変化・成長する超大規模(Twitterデータ)グラフに対して、多様なグラフ解析を高速に処理
◯ Graph500(Green Graph500)ベンチマーク (巨大グラフ, BFS) ISC12 : 358GTEPS (世界3位) , 8.15GTEPS (1ノード世界1位)、SC12 : 5524GTEPS(世界4位), 10.495GTEPS(1ノード世界1位)
◯ 数理計画問題(SDP): (世界記録更新:148万制約 ; 533TFlops)、SC12(Tech. paper) : 疎&密データ計算(24,480CPUコア & 4080GPU)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi でのスレッド数の変更 その5

2013年01月22日 02時34分28秒 | Weblog
以前にも、こちらのブログで何回か触れたように、あまり大きな MIP ではない場合には Gurobi を使う際にそれほど多くのスレッドを使っても意味がないので、次のコマンドでスレッド数を変更して 8 から 16 スレッド程度にするのが良い。

setParam("Theads",8)

以下の計算サーバでは 48 コアを搭載しているので、1問題で 8 スレッドを使って同時に 6 問題を解くという方が 1 問題で 48 スレッド使うよりは効率が良いことが多い。

○計算サーバ : (4 CPU x 12 コア = 48 コア)
CPU : AMD Opteron 6174 (2.20GHz / 12MB L3) x 4個
メモリ : 256GB (16 x 16GB / 1066MHz)
OS : Fedora 17 for x86_64
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

大きな SDP (Sparse Cholesky 分解)

2013年01月21日 01時58分39秒 | Weblog
mDIM の大きな場合でも SCM が疎になれば Sparse Cholesky 分解を適用することができる。しかし疎な SCM を作るときにはマルチスレッド化の効果は見えにくい(時に小さな問題の場合)。

◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3

◯問題
* SDPA sparse format data
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
25724
37
-5460 -24289 363 323 323 323 323 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78

◯実験結果

SDPA start at [Sun Jan 20 23:33:20 2013]
param is ./param.sdpa
data is /home/fujisawa/data/tensorSDP.090227/tensor5551s.dat-s : sparse
* SDPA sparse format data
* File name = temp.dat-s
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
out is out.tensor5551s
NumThreads is set as 32
Full Schur Elements Number 661724176, 6.62e+08
Agg 408471842 (6.17e+01%)->Ext 410784152 (6.21e+01%) [Fill 2312310 (3.49e-01%)]
Est FLOPs Elim = 1.89e+12:MaxMem = 6727MB = 6.57GB:TotMem = 6727MB = 6.57GB
Schur computation : SPARSE
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 -0.00e+00 -2.65e+04 4.6e-02 1.4e-02 2.00e-01
1 9.9e+03 9.5e-01 9.9e-01 +2.03e+03 -2.76e+04 7.7e-02 6.9e-02 2.00e-01
2 9.4e+03 8.8e-01 9.2e-01 +2.98e+03 -3.52e+04 9.2e-02 2.8e-01 2.00e-01
3 9.1e+03 8.0e-01 6.6e-01 +3.56e+03 -9.14e+04 3.8e-01 4.9e-01 2.00e-01
4 6.7e+03 5.0e-01 3.4e-01 +3.53e+03 -2.16e+05 7.3e-01 1.0e+00 2.00e-01
5 2.5e+03 1.3e-01 3.4e-12 +8.87e+02 -3.89e+05 7.8e-01 7.8e-01 2.00e-01
6 7.3e+02 2.9e-02 1.3e-12 +2.94e+02 -4.73e+05 6.6e-01 6.6e-01 2.00e-01
7 3.2e+02 9.8e-03 5.8e-13 +1.61e+02 -5.00e+05 5.7e-01 4.2e-01 2.00e-01
8 1.6e+02 4.2e-03 3.8e-13 +1.21e+02 -4.64e+05 5.9e-01 2.9e-01 2.00e-01
9 7.9e+01 1.7e-03 2.9e-13 +1.04e+02 -4.29e+05 6.1e-01 4.7e-01 2.00e-01
10 3.9e+01 6.8e-04 3.5e-13 +9.61e+01 -3.48e+05 5.8e-01 3.3e-01 2.00e-01
11 2.1e+01 2.8e-04 1.1e-13 +9.33e+01 -2.88e+05 5.3e-01 3.0e-01 2.00e-01
12 1.3e+01 1.3e-04 1.2e-13 +9.21e+01 -2.33e+05 1.1e-01 1.5e-01 2.00e-01
13 1.2e+01 1.2e-04 1.0e-13 +9.17e+01 -2.05e+05 4.6e-01 4.4e-01 2.00e-01
14 7.3e+00 6.4e-05 1.8e-13 +9.12e+01 -1.44e+05 3.7e-01 3.0e-01 2.00e-01
15 5.3e+00 4.0e-05 1.8e-13 +9.08e+01 -1.12e+05 6.7e-01 6.0e-01 2.00e-01
16 2.5e+00 1.3e-05 1.9e-13 +9.04e+01 -6.23e+04 5.1e-01 5.4e-01 2.00e-01
17 1.4e+00 6.4e-06 2.8e-13 +8.97e+01 -3.55e+04 6.0e-01 5.8e-01 2.00e-01
18 7.5e-01 2.6e-06 1.2e-12 +8.90e+01 -1.97e+04 6.1e-01 5.9e-01 2.00e-01
19 3.9e-01 1.0e-06 2.2e-12 +8.78e+01 -1.05e+04 7.2e-01 6.0e-01 2.00e-01
20 1.9e-01 2.8e-07 7.0e-12 +8.52e+01 -5.48e+03 7.9e-01 6.1e-01 2.00e-01
21 9.0e-02 6.0e-08 1.2e-11 +7.82e+01 -2.74e+03 8.0e-01 6.3e-01 2.00e-01
22 4.2e-02 1.2e-08 4.0e-11 +4.75e+01 -1.30e+03 8.3e-01 9.1e-01 2.00e-01
23 1.1e-02 2.0e-09 1.3e-10 +9.52e+00 -3.32e+02 7.6e-01 9.4e-01 2.00e-01
24 2.7e-03 4.9e-10 1.2e-09 +1.78e+00 -7.79e+01 8.0e-01 8.7e-01 2.00e-01
25 8.4e-04 4.9e-10 1.5e-08 +8.60e-01 -2.32e+01 7.4e-01 6.7e-01 2.00e-01
26 3.8e-04 4.9e-10 1.8e-08 +4.86e-01 -1.05e+01 4.6e-01 3.2e-01 2.00e-01
27 2.8e-04 4.9e-10 1.4e-08 +3.79e-01 -7.72e+00 1.4e-01 4.9e-02 2.00e-01
28 2.7e-04 4.9e-10 1.3e-08 +3.22e-01 -7.42e+00 9.1e-02 5.6e-02 2.00e-01
29 2.6e-04 4.9e-10 1.3e-08 +2.46e-01 -7.12e+00 9.6e-02 6.0e-02 2.00e-01
30 2.5e-04 4.9e-10 1.3e-08 +1.71e-01 -6.81e+00 1.0e-01 5.2e-02 2.00e-01
31 2.4e-04 4.9e-10 1.3e-08 +1.62e-01 -6.53e+00 1.8e-01 1.5e-01 2.00e-01
32 2.1e-04 4.9e-10 1.4e-08 +6.01e-03 -5.84e+00 1.5e-01 5.7e-02 2.00e-01
33 2.0e-04 4.9e-10 1.4e-08 -7.84e-02 -5.61e+00 3.5e-01 1.6e-01 2.00e-01
34 1.7e-04 4.9e-10 3.2e-08 -2.70e-01 -4.99e+00 3.2e-01 1.2e-01 2.00e-01
35 1.5e-04 4.9e-10 3.8e-08 -4.05e-01 -4.59e+00 3.0e-01 7.9e-02 2.00e-01
36 1.4e-04 4.9e-10 3.7e-08 -4.90e-01 -4.34e+00 5.9e-01 2.1e-01 2.00e-01
37 1.1e-04 4.9e-10 4.2e-08 -6.43e-01 -3.76e+00 9.4e-01 3.8e-01 2.00e-01
38 7.6e-05 4.9e-10 1.7e-08 -7.64e-01 -2.87e+00 7.8e-01 3.0e-01 2.00e-01
39 5.6e-05 4.9e-10 1.5e-08 -8.82e-01 -2.41e+00 9.1e-01 3.8e-01 2.00e-01
40 3.7e-05 4.9e-10 8.9e-09 -9.90e-01 -1.99e+00 8.8e-01 4.8e-01 2.00e-01
41 2.2e-05 4.9e-10 5.5e-09 -1.04e+00 -1.64e+00 6.5e-01 4.5e-01 2.00e-01
42 1.4e-05 4.9e-10 3.6e-09 -1.08e+00 -1.45e+00 7.1e-01 4.7e-01 2.00e-01
43 8.4e-06 4.9e-10 2.1e-09 -1.10e+00 -1.32e+00 8.5e-01 4.9e-01 2.00e-01
44 4.9e-06 4.9e-10 1.2e-09 -1.11e+00 -1.24e+00 9.7e-01 5.8e-01 2.00e-01
45 2.6e-06 4.9e-10 4.9e-10 -1.11e+00 -1.18e+00 8.5e-01 4.3e-01 2.00e-01
46 1.6e-06 4.9e-10 2.7e-10 -1.12e+00 -1.16e+00 9.6e-01 6.7e-01 2.00e-01
47 7.5e-07 4.9e-10 8.7e-11 -1.12e+00 -1.14e+00 7.8e-01 5.6e-01 2.00e-01
48 4.1e-07 4.9e-10 3.5e-11 -1.12e+00 -1.13e+00 8.7e-01 6.3e-01 1.00e-01
49 1.7e-07 4.9e-10 1.3e-11 -1.12e+00 -1.12e+00 8.8e-01 6.5e-01 1.00e-01
50 7.1e-08 4.9e-10 4.6e-12 -1.12e+00 -1.12e+00 8.0e-01 7.2e-01 1.00e-01
51 2.5e-08 4.9e-10 1.3e-12 -1.12e+00 -1.12e+00 8.0e-01 6.7e-01 1.00e-01
52 1.0e-08 4.9e-10 4.4e-13 -1.12e+00 -1.12e+00 7.8e-01 4.8e-01 1.00e-01
53 5.7e-09 4.9e-10 2.3e-13 -1.12e+00 -1.12e+00 7.6e-01 3.4e-01 1.00e-01
54 3.9e-09 4.9e-10 1.5e-13 -1.12e+00 -1.12e+00 8.3e-01 3.0e-01 1.00e-01
55 2.8e-09 4.9e-10 1.0e-13 -1.12e+00 -1.12e+00 8.9e-01 2.8e-01 1.00e-01
56 2.1e-09 4.9e-10 7.5e-14 -1.12e+00 -1.12e+00 9.5e-01 7.0e-01 1.00e-01
57 7.9e-10 4.9e-10 2.3e-14 -1.12e+00 -1.12e+00 6.5e-01 7.6e-01 1.00e-01
58 2.5e-10 4.9e-10 7.0e-15 -1.12e+00 -1.12e+00 2.6e-01 1.8e-01 1.00e-01
59 2.1e-10 4.9e-10 6.2e-15 -1.12e+00 -1.12e+00 2.6e-01 1.8e-01 1.00e-01

phase.value = pdOPT
Iteration = 59
mu = +2.0829577136872963e-10
relative gap = +1.9846617536523905e-16
gap = -2.2204460492503131e-16
digits = +1.5702313499500137e+01
objValPrimal = -1.1188032646691592e+00
objValDual = -1.1188032646691590e+00
p.feas.error = +4.9272429652815334e-08
d.feas.error = +1.2377760101729011e-11
total time = 8437.921223
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

CentOS 5.9

2013年01月20日 01時50分22秒 | Weblog
以下のように CentOS 5.9 がリリースされたので研究室の CentOS 5.8 を全て 5.9 へバージョンアップした(特に大きなトラブルは無し)。

◯ CentOS 5.8 : 22台 --> CentOS 5.9 へバージョンアップ

RHEL 5.9互換のLinuxディストリビューション「CentOS 5.9」、RHELのリリースから9日間でリリース
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本科学未来館トークイベント

2013年01月19日 00時29分54秒 | Weblog
現在,日本科学未来館にて開催中の第11期メディアラボ「フカシギの数え方」
に関連しまして,1月19日(来週の土曜日)に以下のようなトークイベントが
開催されます.

---------------------------------------------------------------------------
(http://www.miraikan.jst.go.jp/event/130108127564.html より抜粋)

第11期メディアラボ「フカシギの数え方」関連イベント 「フカシギの不思議」
講師: 湊 真一 教授

開催日時:2013年1月19日(土) 14:30~16:00
開催場所:日本科学未来館 3階 実験工房
参加費:入館料のみ
参加方法:当日、会場にお越しください
主催:日本科学未来館
協力:JST ERATO 湊離散構造処理系プロジェクト

おねえさんの動画も大好評の、昨夏から開催している第11期メディアラボ「フ
カシギの数え方」。監修者の湊 真一教授(JST ERATO 湊離散構造処理系プロジェ
クト 研究総括/北海道大学 大学院 情報科学研究科 教授)を招いて、トークイ
ベントを開催します。

展示やアニメを通じて、湊教授が伝えたかったこと、そして離散構造処理研究
の最先端について科学コミュニケーターの落合が迫ります。参加者には特製し
おりをプレゼント!みなさま、お誘い合わせの上、ご参加ください!
---------------------------------------------------------------------------

会場での定員は40名とのことですが,当日の模様は USTREAMでライブ配信
されますので,お時間のある方は是非ご覧いただければと思います.
(ライブ配信は上記の未来館のページ,もしくは
http://www.ustream.tv/channel/6924965 からアクセスしてください)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

改造 stream ベンチ

2013年01月18日 03時36分53秒 | Weblog
stream ベンチマークの比較。サイズ N には 16M = 16777216 を使用。

改善前
Function Rate (MB/s) Avg time Min time Max time
Copy: 81392.3160 0.0033 0.0033 0.0034
Scale: 81693.5065 0.0033 0.0033 0.0034
Add: 84930.8454 0.0048 0.0047 0.0049
Triad: 84768.8531 0.0048 0.0048 0.0048

改造後
Function Rate (MB/s) Avg time Min time Max time
Copy: 88590.7551 0.0031 0.0030 0.0032
Scale: 85489.7424 0.0032 0.0031 0.0033
Add: 91910.1965 0.0045 0.0044 0.0046
Triad: 93528.8176 0.0044 0.0043 0.0045


◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

TSUBAME ESJ Vol.7

2013年01月17日 01時00分44秒 | Weblog
TSUBAME ESJ Vol.7 が発刊されました。私の方では今回、以下の二つの記事を書きました。

大規模半正定値計画問題に対する内点法アルゴリズムの高速計算
High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems

-----------------------------------------------------------------
TSUBAME ESJ Vol.7

大規模半正定値計画問題に対する内点法アルゴリズムの高速計算
古典スピン系における大規模GPUコンピューティング
大規模ウェブテキスト集合からの知識獲得とその応用

TSUBAME ESJ Vol.7

High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems
The multiple GPU calculation for the classical spin model
Knowledge Acquisition from a Large Web Corpus and its Applications

コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする