最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SACSIS 2013 ポスター投稿

2013年03月18日 01時56分17秒 | Weblog
SACSIS 2013 では以下のようにポスター投稿を募集しています。

ポスター発表募集 第11回先進的計算基盤システムシンポジウムSACSIS2013
日時: 2013年5月22日(水)∼5月24日(金)
会場: 仙台国際センター

重要日程
2013年3月19日 ポスター論文 受付開始
2013年4月2日(火) 17:00 ポスター論文 〆切
2013年4月9日 ポスター論文 採否通知
2013年5月22日(水)~24日(金) SACSIS2013開催
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SACSIS2013 と SWoPP 2013

2013年03月17日 03時25分27秒 | Weblog
SACSIS2013 と SWoPP 2013 の日程について、前者は多分参加できません。後者は参加予定です。

SACSIS2013 - 先進的計算基盤システムシンポジウム -
日時: 2013年5月22日(水)∼5月24日(金)
会場: 仙台国際センター

SWoPP 2013 並列/分散/協調処理に関するサマー・ワークショップ
7月31日(水)~8月2日(金) 北九州国際会議場
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ファンドセミナーPart2: さきがけ・CRESTを目指して

2013年03月16日 02時49分29秒 | Weblog
ファンドセミナーPart2: さきがけ・CRESTを目指して

日程: 4月5日 11:00-17:00
  (遠方の方のため、グループ討論は午後からにします)
場所: 国立情報学研究所 1208号室
参加申し込み: uno@nii.jp までお願いします。
 (参加人数把握&ある程度のグループ分けをあらかじめしておきたいので)
 申し込みせず当日飛び入り参加でもOKです。
参加費: 無料
旅費補助: 補助します。宇野までご連絡下さい。

URL: http://research.nii.ac.jp/~uno/salfund/fundseminar.html
プログラム:
11:00-12:00 情報提供: 今年度のさきがけ・CREST、書き物のコツ
13:30-15:00 グループ討論1
15:30-17:00 グループ討論2

 ※ 終了後、懇親会を予定しています。

CREST・さきがけ等ファンドに向けた議論会

研究者にとって、自身の研究の見せ方、説明の仕方は重要なもので、他人にわか
りやすく、興味を持ってもらえる技術は高めて損のないものです。また、自身の
研究を他分野のほうに進め、応用先を見つける、新しい技術やアイディアを手に
入れる、共同で新しい研究を作り、研究の目標を定めてストーリーを組み立てて
いく、といった作業も非常に大切で、縮こまらずに研究を常に大きく広げてゆく
のは研究者として大事な姿勢と考えます。
このような力は、特にファンドを取る際にも重要となります。ファンドは研究の
サポートを得ると言うことだけではなく、議論の機会を与え、また新しい研究仲
間や新しい研究の方向性を与えるものでもあります。今回はJSTの大型ファンド
であるさきがけやCRESTといったファンドを仮想のターゲットとし、研究プラン
の可能性を議論し、それぞれの研究者に新しい研究の方向性を発見してもらい、
同時に研究の展開力を高めていくことを目的とする討論会を企画いたします。
ファンドの仕組みと状況、内容に関する補足説明を行った後、グループに分かれ
て討論会を行います。
申し込みは、情報学研究所 宇野(uno@nii.jp) までメールでご連絡下さい。ま
た、参加者には、ある程度の研究内容プラン、融合研究のアイディア、研究の将
来展望などの中から、自分が意見を持てる点について、A4で1枚程度に(ポンチ
図、大事だと思う点の箇条書きなどの形で)用意していただき、それを討論で材
料として使わせていただきま
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

JST:平成25年度戦略目標の決定: CREST ビッグデータ領域

2013年03月15日 13時39分37秒 | Weblog
もうすぐ公募が出る JST CREST のビッグデータ領域ですが、昨日の JST からの説明によりますと、以下の (1) と (2) は別の研究領域になる予定です(つまり二つ出来ます)。

本戦略目標では,ビッグデータの解析を円滑に実行するための革新的な方法論等の創出等のため,2つの達成目標の実現を目指す。具体的には以下の研究を想定する。
(1)各アプリケーション分野においてビッグデータの利活用を推進しつつ様々な分野 に展開することを想定した次世代アプリケーション基盤技術の創出・高度化
 個別のアプリケーション分野の課題解決とともに,固有技術の他分野展開や新規基盤要素技術の導入を強力に推進する。このため,情報科学・数理科学分野とアプリケーション分野の研究者等による協働研究チーム体制を構築することが期待される。具体的には,以下の研究を推進する。
 ・多様かつ大量のアプリケーションデータ(健康・医療データ,地球観測データ,防災関連データ,ソーシャルデータ等)の転送,圧縮,保管等を容易に実現するための研究
 ・画像データや3次元データ等の多様なデータを検索,比較,解析等することで有意な情報を抽出するための研究
 ・アプリケーションデータから新たな課題の発見や洞察をより正確に行うための研究(疾患要因の解明,気候変動予測,リアルタイム解析による減災,人のニーズの予測等)
 ・定量データから生体,自然現象等に係る多様な数理モデルを構築し,実測データと組み合わせることで新たな知見を得るような,発見的探索スタイルの研究アプローチ推進のための研究基盤創出 

(2)様々な分野のビッグデータの統合解析を行うための次世代基盤技術の創出・高度化・体系化
 情報科学・数理科学分野や人文科学の研究者による,独自の新規基盤要素技術の創出や複数のアプリケーション分野に展開する新規要素技術の創出を行う。具体的には,以下の研究を推進する。
・データクレンジング技術(ノイズ除去,データの正規化,不要なデータ変動の吸収等)やデータに対して自動的に意味や内容に係る注釈を付与する技術
・高度な圧縮技術,圧縮したままで検索する技術,秘密性や匿名性を損なわないままマイニングする技術
・データマイニング技術や機械学習の高度化(大量・多様なデータからのモデリング技術,異種データから関連性を探索する技術等)
・多様なアプリケーションデータの相関や関係性から新たな洞察を導くための可視化技術
・ビッグデータを共有・流通するためのシステム技術(データの加工,メタデータ管理,トレーサビリティ,匿名化,セキュリティ,課金等)
・課題の本質やビッグデータの構造を見いだすための数理的手法
 
 なお,(1)の次世代アプリケーション基盤技術の創出・高度化に当たっては,(2)の研究で得られる次世代基盤技術を取り込みながら推進することが効果的であり,また,(2)の次世代基盤技術の創出・高度化・体系化に当たっては,(1)の研究で得られる次世代アプリケーション基盤技術やデータを共有,活用しながら研究を進めることが効果的であることから,(1)と(2)の研究が相互に連携することが求められる。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

OpenBLAS 0.2.5 から 0.2.6

2013年03月14日 01時09分12秒 | Weblog
OpenBLASが 0.2.5 から 0.2.6 にバージョンアップした。SandyBridge 等の CPU で以下のような性能向上が見られる。

○ SDPA 7.4.0
○問題1:theta6.dat-s
OpenBLAS 0.2.5 : 7.29s
OpenBLAS 0.2.6 : 6.27s

○問題2:nug12_r2.dat-s
OpenBLAS 0.2.5 : 57.12s
OpenBLAS 0.2.6 : 56.59s

○問題3:NH3+.2A2".STO6G.pqgt1t2p.dat-s
OpenBLAS 0.2.5 : 128.53s
OpenBLAS 0.2.6 : 122.96s

◯計算サーバ
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.4
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

倍精度 × 4倍精度(Double-double) △ 任意精度 ◯

2013年03月13日 02時12分13秒 | Weblog
倍精度では全く解けなくて、4倍精度でも高精度に解くことができず、任意精度(256bit)演算でやっと高精度に解ける例が見つかった。以下はある SDP の例:通常は4倍精度で十分なことが多い。

◯倍精度:SDPA 7.4.0
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 -0.00e+00 -1.50e+05 7.5e-01 5.0e-01 2.00e-01
1 3.4e+03 2.5e-01 5.0e-01 -1.91e+00 -1.42e+05 5.4e-01 5.7e-01 2.00e-01
2 1.9e+03 1.2e-01 2.2e-01 -4.09e+00 -1.17e+05 3.7e-01 5.4e-01 2.00e-01
3 1.3e+03 7.3e-02 1.0e-01 -5.87e+00 -1.00e+05 5.2e-01 6.6e-01 2.00e-01
4 7.6e+02 3.5e-02 3.4e-02 -7.14e+00 -8.37e+04 5.8e-01 7.4e-01 2.00e-01
5 3.9e+02 1.4e-02 8.6e-03 -7.27e+00 -6.55e+04 7.4e-01 7.5e-01 2.00e-01
6 1.5e+02 3.8e-03 2.2e-03 -6.76e+00 -4.49e+04 7.0e-01 7.5e-01 2.00e-01
7 5.9e+01 1.1e-03 5.4e-04 -6.23e+00 -2.34e+04 6.8e-01 7.2e-01 2.00e-01
8 2.5e+01 3.7e-04 1.5e-04 -5.88e+00 -1.14e+04 6.1e-01 6.3e-01 2.00e-01
9 1.2e+01 1.4e-04 5.7e-05 -5.71e+00 -6.06e+03 6.9e-01 5.9e-01 2.00e-01
10 6.0e+00 4.4e-05 2.4e-05 -5.60e+00 -3.35e+03 6.8e-01 6.4e-01 2.00e-01
11 2.8e+00 1.4e-05 8.6e-06 -5.54e+00 -1.69e+03 6.9e-01 2.5e-01 2.00e-01
cholesky miss condition :: not positive definite :: info = 627 :: line 783 in sdpa_linear.cpp
There are some possibilities. :: line 784 in sdpa_linear.cpp
1. SDPA terminates due to inaccuracy of numerical error :: line 785 in sdpa_linear.cpp
2. The input problem may not have (any) interior-points :: line 786 in sdpa_linear.cpp
3. Input matrices are linearly dependent :: line 787 in sdpa_linear.cpp
12 2.1e+00 4.3e-06 6.4e-06 -5.52e+00 -1.35e+03 6.9e-01 2.5e-01 2.00e-01

phase.value = noINFO
Iteration = 12
mu = +2.0707554953433505e+00
relative gap = +1.9837536366201112e+00
gap = +1.3483476948223692e+03
digits = -2.9748773591292321e-01
objValPrimal = -5.5212870711713906e+00
objValDual = -1.3538689818935406e+03
p.feas.error = +4.3136488422590435e-04
d.feas.error = +2.4069636750887774e-02
total time = 12.092648

◯ 4倍精度 : SDPA-DD 7.1.2
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 -0.00e+00 -1.50e+05 7.5e-01 5.0e-01 2.00e-01
1 3.4e+03 2.5e-01 5.0e-01 -1.91e+00 -1.42e+05 5.4e-01 5.7e-01 2.00e-01
2 1.9e+03 1.2e-01 2.2e-01 -4.09e+00 -1.17e+05 3.7e-01 5.4e-01 2.00e-01
3 1.3e+03 7.3e-02 1.0e-01 -5.87e+00 -1.00e+05 5.2e-01 6.6e-01 2.00e-01
4 7.6e+02 3.5e-02 3.4e-02 -7.14e+00 -8.37e+04 5.8e-01 7.4e-01 2.00e-01
5 3.9e+02 1.4e-02 8.6e-03 -7.27e+00 -6.55e+04 7.4e-01 7.5e-01 2.00e-01
6 1.5e+02 3.8e-03 2.2e-03 -6.76e+00 -4.49e+04 7.0e-01 7.5e-01 2.00e-01
7 5.9e+01 1.1e-03 5.4e-04 -6.23e+00 -2.34e+04 6.8e-01 7.2e-01 2.00e-01
8 2.5e+01 3.7e-04 1.5e-04 -5.88e+00 -1.14e+04 6.1e-01 6.3e-01 2.00e-01
9 1.2e+01 1.4e-04 5.7e-05 -5.71e+00 -6.06e+03 6.9e-01 5.9e-01 2.00e-01
10 5.9e+00 4.4e-05 2.4e-05 -5.60e+00 -3.35e+03 6.8e-01 6.4e-01 2.00e-01
11 2.8e+00 1.4e-05 8.5e-06 -5.54e+00 -1.68e+03 7.1e-01 6.9e-01 2.00e-01
12 1.2e+00 4.1e-06 2.6e-06 -5.52e+00 -7.72e+02 7.3e-01 7.3e-01 2.00e-01
13 5.0e-01 1.1e-06 7.2e-07 -5.52e+00 -3.31e+02 7.3e-01 7.3e-01 2.00e-01
14 2.0e-01 3.0e-07 2.0e-07 -5.52e+00 -1.43e+02 7.2e-01 7.3e-01 2.00e-01
15 8.3e-02 8.3e-08 5.3e-08 -5.54e+00 -6.31e+01 7.3e-01 7.9e-01 2.00e-01
16 3.0e-02 2.3e-08 1.1e-08 -5.57e+00 -2.69e+01 8.1e-01 8.1e-01 2.00e-01
17 1.0e-02 4.4e-09 2.1e-09 -5.64e+00 -1.31e+01 7.9e-01 8.2e-01 2.00e-01
18 3.5e-03 9.0e-10 3.8e-10 -5.73e+00 -8.27e+00 6.1e-01 6.1e-01 2.00e-01
19 1.8e-03 3.6e-10 1.5e-10 -5.81e+00 -7.09e+00 6.1e-01 6.4e-01 2.00e-01
20 8.6e-04 1.4e-10 5.2e-11 -5.87e+00 -6.49e+00 6.2e-01 6.6e-01 2.00e-01
21 4.1e-04 5.2e-11 1.8e-11 -5.91e+00 -6.21e+00 7.1e-01 6.6e-01 2.00e-01
22 1.9e-04 5.2e-11 6.0e-12 -5.94e+00 -6.08e+00 8.2e-01 6.7e-01 2.00e-01
23 8.4e-05 5.2e-11 2.0e-12 -5.96e+00 -6.01e+00 7.8e-01 6.1e-01 1.00e-01
24 3.6e-05 5.2e-11 7.6e-13 -5.96e+00 -5.99e+00 8.2e-01 7.2e-01 1.00e-01
25 1.2e-05 5.2e-11 2.2e-13 -5.96e+00 -5.97e+00 9.1e-01 7.4e-01 1.00e-01
26 3.9e-06 5.2e-11 5.6e-14 -5.96e+00 -5.97e+00 9.6e-01 8.7e-01 1.00e-01
27 8.3e-07 5.2e-11 7.5e-15 -5.96e+00 -5.96e+00 9.7e-01 8.5e-01 1.00e-01
28 1.9e-07 5.2e-11 1.1e-15 -5.96e+00 -5.96e+00 8.8e-01 5.5e-01 1.00e-01
29 9.1e-08 5.2e-11 5.1e-16 -5.96e+00 -5.96e+00 8.8e-01 5.5e-01 0.00e+00

phase.value = pdFEAS
Iteration = 29
mu = 9.1470308661740907e-08
relative gap = 5.1314652211106639e-06
gap = 6.8145379952996981e-05
digits = 5.2897586102126146e+00
objValPrimal = -5.9631117177580188e+00
objValDual = -5.9631423173369189e+00
p.feas.error = 5.2236915537834309e-09
d.feas.error = 1.9124719921596923e-12
relative eps = 4.9303806576313200e-32
total time = 738.980

◯任意精度(256bit) : SDPA-GMP 7.1.2
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 +0.00e+00 -1.50e+05 7.5e-01 5.0e-01 2.00e-01
1 3.4e+03 2.5e-01 5.0e-01 -1.91e+00 -1.42e+05 5.4e-01 5.7e-01 2.00e-01
2 1.9e+03 1.2e-01 2.2e-01 -4.09e+00 -1.17e+05 3.7e-01 5.4e-01 2.00e-01
3 1.3e+03 7.3e-02 1.0e-01 -5.87e+00 -1.00e+05 5.2e-01 6.6e-01 2.00e-01
4 7.6e+02 3.5e-02 3.4e-02 -7.14e+00 -8.37e+04 5.8e-01 7.4e-01 2.00e-01
5 3.9e+02 1.4e-02 8.6e-03 -7.27e+00 -6.55e+04 7.4e-01 7.5e-01 2.00e-01
6 1.5e+02 3.8e-03 2.2e-03 -6.76e+00 -4.49e+04 7.0e-01 7.5e-01 2.00e-01
7 5.9e+01 1.1e-03 5.4e-04 -6.23e+00 -2.34e+04 6.8e-01 7.2e-01 2.00e-01
8 2.5e+01 3.7e-04 1.5e-04 -5.88e+00 -1.14e+04 6.1e-01 6.3e-01 2.00e-01
9 1.2e+01 1.4e-04 5.7e-05 -5.71e+00 -6.06e+03 6.9e-01 5.9e-01 2.00e-01
10 5.9e+00 4.4e-05 2.4e-05 -5.60e+00 -3.35e+03 6.8e-01 6.4e-01 2.00e-01
11 2.8e+00 1.4e-05 8.5e-06 -5.54e+00 -1.68e+03 7.1e-01 6.9e-01 2.00e-01
12 1.2e+00 4.1e-06 2.6e-06 -5.52e+00 -7.72e+02 7.3e-01 7.3e-01 2.00e-01
13 5.0e-01 1.1e-06 7.2e-07 -5.52e+00 -3.31e+02 7.3e-01 7.3e-01 2.00e-01
14 2.0e-01 3.0e-07 2.0e-07 -5.52e+00 -1.43e+02 7.2e-01 7.3e-01 2.00e-01
15 8.3e-02 8.3e-08 5.3e-08 -5.54e+00 -6.31e+01 7.3e-01 7.9e-01 2.00e-01
16 3.0e-02 2.3e-08 1.1e-08 -5.57e+00 -2.69e+01 8.1e-01 8.1e-01 2.00e-01
17 1.0e-02 4.4e-09 2.1e-09 -5.64e+00 -1.31e+01 7.9e-01 8.2e-01 2.00e-01
18 3.5e-03 9.0e-10 3.8e-10 -5.73e+00 -8.27e+00 6.1e-01 6.1e-01 2.00e-01
19 1.8e-03 3.6e-10 1.5e-10 -5.81e+00 -7.09e+00 6.1e-01 6.4e-01 2.00e-01
20 8.6e-04 1.4e-10 5.2e-11 -5.87e+00 -6.49e+00 6.2e-01 6.6e-01 2.00e-01
21 4.1e-04 5.2e-11 1.8e-11 -5.91e+00 -6.21e+00 7.1e-01 6.6e-01 2.00e-01
22 1.9e-04 5.2e-11 6.0e-12 -5.94e+00 -6.08e+00 8.2e-01 6.7e-01 2.00e-01
23 8.4e-05 5.2e-11 2.0e-12 -5.96e+00 -6.01e+00 7.8e-01 6.1e-01 1.00e-01
24 3.6e-05 5.2e-11 7.6e-13 -5.96e+00 -5.99e+00 8.2e-01 7.2e-01 1.00e-01
25 1.2e-05 5.2e-11 2.2e-13 -5.96e+00 -5.97e+00 9.1e-01 7.4e-01 1.00e-01
26 3.9e-06 5.2e-11 5.6e-14 -5.96e+00 -5.97e+00 9.6e-01 8.7e-01 1.00e-01
27 8.3e-07 5.2e-11 7.5e-15 -5.96e+00 -5.96e+00 9.7e-01 8.5e-01 1.00e-01
28 1.9e-07 5.2e-11 1.1e-15 -5.96e+00 -5.96e+00 8.8e-01 6.0e-01 1.00e-01
29 8.3e-08 5.2e-11 4.5e-16 -5.96e+00 -5.96e+00 6.8e-01 1.9e-01 1.00e-01
30 6.8e-08 5.2e-11 3.6e-16 -5.96e+00 -5.96e+00 1.9e-01 4.5e-02 1.00e-01
31 6.6e-08 5.2e-11 3.5e-16 -5.96e+00 -5.96e+00 1.0e-01 1.1e-01 1.00e-01
32 6.1e-08 5.2e-11 3.1e-16 -5.96e+00 -5.96e+00 4.4e-02 2.7e-02 1.00e-01
33 6.0e-08 5.2e-11 3.0e-16 -5.96e+00 -5.96e+00 4.4e-02 2.7e-02 1.00e-01

phase.value = pdOPT
Iteration = 33
mu = 6.0091957050090305e-08
relative gap = 7.3389529025869560e-78
gap = 4.4768508002317277e-05
digits = 7.7134365899357491e+01
objValPrimal = -5.9631207562267722e+00
objValDual = -5.9631207562267722e+00
p.feas.error = 5.2236915538017196e-09
d.feas.error = 1.1271715090988795e-12
relative eps = 8.6361685550944446e-78
total time = 6176.100
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

日本応用数理学会2013年研究部会連合発表会 「産業における応用数理」研究部会セッション

2013年03月12日 10時22分26秒 | Weblog
=======================================================
☆ 連合発表会全体案内

日程:2013年3月14日(木)~ 15日(金)
 会場:東洋大学 白山キャンパス
    〒112-8606 東京都文京区白山5-28-20
 アクセス:http://www.toyo.ac.jp/access/access_j.html

 参加費(会員):学生: 1,000円,一般: 2,000円,
 参加費(非会員): 学生: 2,000円,一般: 4,000円

 連合発表会全体Webページ:
   http://www2.toyo.ac.jp/~ezawa/jsiam/index.html


☆ 「産業における応用数理」研究部会セッション案内

 日程:2013年3月14日(木)14:40 ~ 17:00
 会場:会場[B] (6210教室)
 「産業における応用数理」研究部会Webページ:
   http://www.cs.tsukuba.ac.jp/~sakurai/ag_acmi/acmi_spring-meeting2013.html
 プログラム:

  【産業における応用数理(1)】14:40~16:00
    講演1 14:40~15:00
    『大規模流体解析技術の産業応用』
    山出 吉伸 (みずほ情報総研)

    講演2 15:00~15:20
    『建設業務における数値気流解析の活用』
   挾間 貴雅 (鹿島建設)

    講演3 15:20~15:40
    『各種実問題に対する熱流体シミュレーションの現状と課題』
    堀之内 成明 (豊田中央研究所)

    講演4 15:40~16:00
    『物質科学における量子力学的第一原理計算』
    岩田 潤一 (東京大学)

  【休憩 10分】16:00~16:10

  【産業における応用数理(2)】16:10~17:00
    パネルディスカッション「応用数理から見た次世代スパコンの開発と利用」

    モデレータ:
      今村 俊幸(理化学研究所)

    パネリスト:
      片桐 孝洋 (東京大学)
      藤澤 克樹 (中央大学)
      秋葉 博 (アライドエンジニアリング)
=======================================================
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

静音ラック 安定性

2013年03月11日 02時31分12秒 | Weblog
以下の静音ラック内の計算サーバについては、断続的に数値実験を行っていますが、とりあえず熱暴走せずに動いています。静音ラック自体は下から吸気、上から排気というエアーフローになっていますので、部屋が冷房で冷えていれば安定して動作すると言われています。ただし、本当に夏場の暑さに耐えられるかどうかについては夏になってみないとわかりません。


◯静音ラック


◯最適化問題(SDP)用 GPU 計算クラスタ

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Cuda 5.0 と Fermi と dgemm

2013年03月10日 11時09分41秒 | Weblog
いろいろと試してみたが、CUDA 5.0 上では Fermi 用の高性能 dgemm (行列積)が動作しない。

◎ CUDA 4.2 + Fermi + 高性能 dgemm の組合せは OK
◎ CUDA 5.0 + Fermi + CUBLAS の組合せは OK (ただし性能はあまり高くない)
◎ CUDA 5.0 + Kepler + CUBLAS の組合せは OK (性能も高いらしい)

というわけなので、Fermi のシステムでは無理に CUDA 4.2 から 5.0 に上げなくても良いかもしれない

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ERATOセミナー

2013年03月09日 00時55分14秒 | Weblog
本日ですが、以下のERATOセミナーが開催されます。我々も関係者ですので参加する予定です。

開催日 :2013年3月9日(土曜日)
開催時間:10:30~12:00
発表者 :岩下洋哲(JST ERATO研究員),中澤 吉男(アマチュアプログラマー)
タイトル:最小完全ハッシュ関数を用いたグリッドグラフ上の効率的なパス数え上げ
開催場所:北大工学部C304 ERATOセミナ室

発表の概要:
正方形を縦横それぞれ n 分割してできる (n+1)×(n+1) グリッドグラフにおい
て、対角の2頂点を結ぶパスの数は n に対して急激に増大する。例えば n=10
に対しては 10^24 もの数となり、もはや一つずつ列挙するようなことはできな
い大きさである。これまでに Knuth のアルゴリズムに基づく方法で n=21 まで
のパス数が計算されていたが、我々はグリッドグラフの性質を利用して計算速
度と使用メモリを大幅に改善し、n=23 までの計算に成功した
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

JST:平成25年度戦略目標の決定

2013年03月08日 01時16分19秒 | Weblog
JST で以下の研究領域が出来る予定です。詳細は内容を見ていただければわかりますが、最適化やOR系の研究者が参加しやすい分野となっています。

1.戦略目標名

 分野を超えたビッグデータ利活用により新たな知識や洞察を得るための革新的な情報技術及びそれらを支える数理的手法の創出・高度化・体系化
2.達成目標

 情報科学・数理科学分野とビッグデータの利活用により大きな社会的インパクトを生むような様々な研究分野(アプリケーション分野)との協働により研究を進め,アプリケーション分野での課題解決を通じてビッグデータから新たな知識や洞察を得ることを可能とする次世代アプリケーション技術を創出し,高度化すると同時に,様々な分野のビッグデータを統合解析することを可能とする共通基盤技術の構築を目指す。そのため,以下の目標の達成を目指す。

○各アプリケーション分野においてビッグデータの利活用を推進しつつ様々な分野に展開することを想定した次世代アプリケーション基盤技術の創出・高度化
○様々な分野のビッグデータの統合解析を行うための次世代基盤技術の創出・高度化・体系化

http://www.mext.go.jp/b_menu/houdou/25/03/1331298.htm
http://www.mext.go.jp/b_menu/houdou/25/03/attach/1331492.htm

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「多倍長精度計算フォーラム」 第3回研究会のご案内

2013年03月07日 02時03分51秒 | Weblog
「多倍長精度計算フォーラム」 第3回研究会のご案内

日時:平成25年3月8日(金) 10:00 開始
会場:工学院大学 新宿校舎 28階 第4会議室

プログラム
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

静音ラック作業 終了

2013年03月06日 01時43分49秒 | Weblog
全体の計算サーバの台数から見ると一部ですが、以下のように静音ラックへの収納作業は終了しました。

◯静音ラック


◯Fusion-IO 搭載グラフ&データ解析サーバ等

上から
1: SandyBridge-EP マシン:Intel Xeon E5-2650 2.00GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.3
2: SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.3
3: SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
SDD Fusion IO 1.2TB SSD Card 1.2TB x 1
SSD SATA SSD 600GB x 3
HDD Enterprize 3.5" 3TB SATA HDD 3TB x 1
OS : CentOS 6.3
4: SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3
5: Westmere-EX 40 コアマシン
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
OS : CentOS 6.3

◯最適化問題(SDP)用 GPU 計算クラスタ


Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

静音ラック作業 収納完了

2013年03月05日 01時08分03秒 | Weblog
作業はほぼ予定通りで、静音ラックへの収納作業は完了しました。5日は電源やネットワークの接続作業やサーバの動作確認等を行う予定です。




コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Intel Xeon 5670 とメモリバンド幅 その3

2013年03月04日 01時36分18秒 | Weblog
前回の続きで Graph500 のプログラムを最新版に変更してみた。HT(24コア)まで含めると両者の差はまた広がった。



◯Graph500:
median_TEPS: 3.35214696043723011e+09 : TSUBAME 2.0 : 12コア
median_TEPS: 3.09271218051088619e+09 : TSUBAME 2.0 : 24コア
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 25238.3844 0.0013 0.0013 0.0018
Scale: 23877.9093 0.0014 0.0013 0.
Add: 23976.0143 0.0020 0.0020 0.0020
Triad: 24781.7075 0.0022 0.0019 0.0045
-------------------------------------------------------------


◯Graph500
median_TEPS: 3.89977029220511246e+09 : OPT クラスタ(変更後): 12コア
median_TEPS: 4.15981347531130791e+09 : OPT クラスタ(変更後): 24コア
-------------------------------------------------------------
Function Rate (MB/s) Avg time Min time Max time
Copy: 29407.9159 0.0011 0.0011 0.0011
Scale: 28520.5542 0.0011 0.0011 0.0011
Add: 28814.4543 0.0017 0.0017 0.0017
Triad: 29720.4889 0.0016 0.0016 0.0016
-------------------------------------------------------------


◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel X5670 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps

◯ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.9 for x86_64

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする