最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

夏期縮退運転(ピークシフト)

2012年06月30日 01時10分43秒 | Weblog
今年の夏の電力供給は関東は関西ほど切迫していないように言われるが、東京湾岸の火力発電所に事故等が発生すれば一気に逼迫することは確実な状況となっている。

TSUBAMEの夏期縮退運転(ピークシフト)について(6/29更新)
縮退運転期間 7/5(木)~9/28(金)

当研究室のクラスタ計算機やサーバ等も全体の 約1/3~1/2 を停止する予定。神戸の某スパコンは??
Green Graph500 の測定もあるので、FPGA, Fusion-IO(ioDrive)等で思いっきりエコでグリーンな計算機を構築する計画もある。
コメント
この記事をはてなブックマークに追加

SOTA つくば合宿

2012年06月29日 02時24分44秒 | Weblog
明日(30日)からつくば合宿が開始されます。発表と宿泊以外の事前登録は不要です。プログラム等も以下のホームページから公表されています。

最適化の理論と応用 -- 未来を担う若手研究者の集い2012 --
開催日 : 2012年6月30日(土), 7月1日(日)
会 場 : 筑波大学 筑波キャンパス 春日地区 講堂
参加費 : 無料(ただし,宿泊,懇親会への参加は有料)
事前登録 : 不要

コメント
この記事をはてなブックマークに追加

GPUコンピューティング:講義ノート公開中

2012年06月28日 01時04分40秒 | Weblog
東工大の授業 GPU コンピューティングの講義ノートが公開されています。初心者から上級者まで GPU の学習に使うのも良いと思いますし、趣味のコンピューティングの参考に使うのも良いと思います。特に第9回はまだ情報が少ない OpenACC についての講義でこの辺は非常に参考になります。

第1回 第1回 GPU コンピューティングの背景と現状 講義

第2回 GPUアーキテクチャの変遷-さまざまな通信バンド幅 講義

第3回 GPUにおける並列処理とCUDA C プログラミング概要 講義

第4回 CUDAプログラミング基礎 -メモリバンド幅測定- 講義

第5回 TSUBAME2.0の見学 講義

第6回 Pinned メモリと Zero Copy 講義

第7回 Unified Virtual Addressing と Peer-to-Peer Direct Transfer 講義

第8回 thread の実行方式とWarp 講義

第9回 指示行(ディレクティブ)挿入によるGPUの利用: OpenACC 講義

第10回 Shared メモリの利用 講義

◯とりあえず現時点ではここまで。

第11回 CUDA のAtomic演算 講義

第12回 CUDA による GPU コンピューティングの応用例 講義

第13回 CUDA Fortran 講義

第14回 演習 講義

第15回 Open CL プログラミング
コメント
この記事をはてなブックマークに追加

Green Graph500

2012年06月27日 02時10分09秒 | Weblog
Green Graph500 のホームページと及び現在の submission rules のドキュメント

以下は ISC12 Graph500 BoF セッションでの Green Graph500 の紹介:




コメント
この記事をはてなブックマークに追加

SDPA 7.4.0 と 7.3.6 その4

2012年06月26日 01時00分04秒 | Weblog
昨日の続きで、全体時間ではなく具体的な中身(ボトルネックとなる二つの部分)の比較を行う。CHOLESKY の部分は基本的に 7.3.6 と 7.4.0 で違いが無いので、性能的にもほぼ同じ。ELEMENTS の部分は疎な SCM の場合のマルチスレッド化が比較的良く成功している。

◯ SDPA 7.3.6 (LP64)
◯ SDPA 7.4.0 (ILP64)

◯問題:BroydenBand400.dat-s

◯実行結果:ELEMENTS (SCM の生成)


◯実行結果:CHOLESKY (SCM の分解)


◯SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz 8 Core 20M L3 cache x 2
CPU Fan INTEL 純正水冷クーラー x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
SSD 120GB SSD(起動・OS用)
HDD Enterprize 1TB SATA HDD
DVD DVD-RAM
GPGPU NVIDIA GeForce 580搭載 3GB Memory
電源 850W 以上の80PLUS 高効率電源
OS : CentOS 6.2
コメント
この記事をはてなブックマークに追加

SDPA 7.4.0 と 7.3.6 その3

2012年06月25日 02時02分50秒 | Weblog
SDPA 7.4.0 と 7.3.6 の比較で今回は SCM が疎になる場合におけるマルチスレッドの特性や有効性を調べてみた。スレッド数を1から16まで変更しながら、とりあえず今回は全体の実行時間を測定して比較を行った。

◯ SDPA 7.3.6 (LP64)
◯ SDPA 7.4.0 (ILP64)

◯問題:BroydenBand400.dat-s と SCM が疎になる特性


◯実行結果


◯SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz 8 Core 20M L3 cache x 2
CPU Fan INTEL 純正水冷クーラー x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
SSD 120GB SSD(起動・OS用)
HDD Enterprize 1TB SATA HDD
DVD DVD-RAM
GPGPU NVIDIA GeForce 580搭載 3GB Memory
電源 850W 以上の80PLUS 高効率電源
OS : CentOS 6.2

コメント
この記事をはてなブックマークに追加

Kernel 3 Single Source Shortest Paths

2012年06月24日 08時57分43秒 | Weblog
次回の Graph500 から登場予定の新カーネル Single Source Shortest Paths(SSSP) について。



公式のホームページにはまだ何も出ていないが、非公式な情報はいろいろ伝えられている。枝に重みが付き、厳密な最短路(近似という意味ではなく)を(一つ)求めて、parent tree を出力する。その後は validation を行うので、その辺は基本的に Kernel 2 BFS と同じになるが、基本的に Kernel 2 BFS と Kernel 3 SSSP は separate されていて(つまり別のプログラム)、メモリ上の計算データは別になる予定。なるべく早めかつ公式にアナウンスしていただきたい。
コメント
この記事をはてなブックマークに追加

PCクラスタワークショップ in 柏

2012年06月23日 03時11分51秒 | Weblog
以下のワークショップに参加する予定ですが、すでに事前登録期間は終わっています。空きがあるようであれば、まだ参加できるかもしれません。

PCクラスタワークショップ in 柏

主催 PCクラスタコンソーシアム
共催 東京大学 情報基盤センター
会場 東京大学 柏キャンバス 第2総合研究棟 3階315室 会議室2 
参加費 無料
定員 70名
事前登録 6月22日まで (定員になり次第締め切ります)

開催趣旨

東京大学情報基盤センターとの共催で東京大学柏キャンバスで、「PCクラスタワークショップ in 柏」を開催いたします。
今回のワークショップでは、東京大学物性研究所の藤堂先生より最先端の計算物理科学アプリケーションについての特別講演に加え、弊コンソーシアム専門部会活動によるPCクラスタへの取り組みを紹介いたします。また、PCクラスタの大規模化に伴い緊喫の課題となっている「Big Data」をテーマにコンソーシアム会員企業からの発表を行います。さらには、東京大学情報基盤センターの新スパコン「FX10」についての講演に加え、スーパーコンピュータシステムの紹介および施設見学を行います。最新のPCクラスタを取り巻く技術動向が満載のワークショップです。
コメント
この記事をはてなブックマークに追加

ISC12 : Graph 500 まとめ

2012年06月22日 18時20分28秒 | Weblog
結果から見ればハードウェア性能の差などから IBM BG/Q 完勝となった The 4th Graph500 ですが、日本勢(JST CREST ポストペタ Graph チーム) が 3, 4, 34(1ノード)位にとなり、第2勢力としての日本のプレゼンスを示すことには成功したと思います。特に世界初の大規模 GPU 実装での TSUBAME2.0 (4位)の成果は NVIDIA や Intel 等から大きな注目を受けました。またアプリ側との co-design で作られた BG/Q の対グラフ探索性能は凄まじく、現時点でのスコアは全体の 1/3 のノードしか使用していないので、秋の The 5th Graph500 ではさらに性能が大きく伸びることが期待されます。

BoF 3: Fourth Graph500 List
June 19, 2012, 11:30 AM - 12:15 PM
Hall C2.1, CCH - Congress Center Hamburg

◯ BOF セッション開始:三つのカーネルの説明


◯ グラフ解析の応用分野(ビジネス関係)


◯ 4th Graph500 List の解説


◯ TSUBAME2.0 (GPU版):世界4位 (高解像度版)


◯ FX10 : 世界3位 (高解像度版)


◯ 1 ノードでの結果:1ノード(CPU のみ:大きな Scale 値)では世界最速レベル
コメント
この記事をはてなブックマークに追加

ISC12 : Graph500 測定結果

2012年06月21日 00時15分57秒 | Weblog
The 4th Graph500 List

今回は当 CREST チームで 東工大スパコン TSUBAME2.0(TSUBAMEグランドチャレンジ 平成24年度春期を利用)と東大スパコン FX10 (2012年度 FX10 スーパーコンピュータシステム大規模 HPC チャレンジを利用)を用いて Graph500 用のソフトウェア開発と測定を行いました。以下に詳細な結果がありますが、東工大で実行した Graph500 のプログラムは世界初の大規模グラフ用 GPU 実装となります。

FX10
CPU のみの実装 : Scale 38, TEPS 358.10 GE/s
TSUBAME2.0
1:CPU のみの実装 : Scale 37, TEPS 202.68 GE/s
2:CPU + GPU : Scale 35, TEPS 317.09 GE/s

○東大 FX10 の測定結果
SCALE: 38
edgefactor: 16
NBFS: 64
graph_generation: 675.504
num_mpi_processes: 4096
construction_time: 1528.97
redistribution_time: 898.932
min_time: 11.5864
firstquartile_time: 11.9092
median_time: 12.2747
thirdquartile_time: 13.0804
max_time: 15.4257
mean_time: 12.5634
stddev_time: 0.851167
min_nedge: 4.3965448591e+12
firstquartile_nedge: 4.3965448591e+12
median_nedge: 4.3965448591e+12
thirdquartile_nedge: 4.3965448591e+12
max_nedge: 4.3965448591e+12
mean_nedge: 4.3965448591e+12
stddev_nedge: 0
min_TEPS: 2.85014e+11
firstquartile_TEPS: 3.36118e+11
median_TEPS: 3.58178e+11
thirdquartile_TEPS: 3.69171e+11
max_TEPS: 3.79459e+11
harmonic_mean_TEPS: 3.49947e+11
harmonic_stddev_TEPS: 2.98702e+09
min_validate: 318.125
firstquartile_validate: 636.232
median_validate: 647.2
thirdquartile_validate: 651.027
max_validate: 666.719
mean_validate: 627.201
stddev_validate: 57.6309

○ 東工大 TSUBAME2.0 の測定結果(CPUのみ)
SCALE: 37
edgefactor: 16
NBFS: 64
graph_generation: 129.33
num_mpi_processes: 4096
construction_time: 1213.19
redistribution_time: 358.358
min_time: 10.3144
firstquartile_time: 10.6738
median_time: 10.8494
thirdquartile_time: 11.3397
max_time: 21.2024
mean_time: 11.3639
stddev_time: 1.71612
min_nedge: 2.1990108574e+12
firstquartile_nedge: 2.1990108574e+12
median_nedge: 2.1990108574e+12
thirdquartile_nedge: 2.1990108574e+12
max_nedge: 2.1990108574e+12
mean_nedge: 2.1990108574e+12
stddev_nedge: 0
min_TEPS: 1.03715e+11
firstquartile_TEPS: 1.93922e+11
median_TEPS: 2.02684e+11
thirdquartile_TEPS: 2.0602e+11
max_TEPS: 2.13198e+11
harmonic_mean_TEPS: 1.93508e+11
harmonic_stddev_TEPS: 3.68169e+09
min_validate: 181.293
firstquartile_validate: 218.825
median_validate: 243.493
thirdquartile_validate: 270.473
max_validate: 337.786
mean_validate: 247.784
stddev_validate: 37.0499

○東工大 TSUBAME2.0 の測定結果(CPU + GPU)
SCALE: 35
edgefactor: 16
NBFS: 64
graph_generation: 31.6246
num_mpi_processes: 4096
construction_time: 536.357
redistribution_time: 221.01
min_time: 1.64677
firstquartile_time: 1.687
median_time: 1.73373
thirdquartile_time: 1.83146
max_time: 7.33673
mean_time: 1.84386
stddev_time: 0.702187
min_nedge: 5.4975230329e+11
firstquartile_nedge: 5.4975230329e+11
median_nedge: 5.4975230329e+11
thirdquartile_nedge: 5.4975230329e+11
max_nedge: 5.4975230329e+11
mean_nedge: 5.4975230329e+11
stddev_nedge: 0
min_TEPS: 7.49315e+10
firstquartile_TEPS: 3.00172e+11
median_TEPS: 3.17092e+11
thirdquartile_TEPS: 3.25875e+11
max_TEPS: 3.33836e+11
harmonic_mean_TEPS: 2.98153e+11
harmonic_stddev_TEPS: 1.43052e+10
min_validate: 31.4446
firstquartile_validate: 51.1974
median_validate: 61.0327
thirdquartile_validate: 74.4082
max_validate: 116.079
mean_validate: 62.5817
stddev_validate: 17.7331
コメント
この記事をはてなブックマークに追加

ISC 12 展示内容

2012年06月20日 07時54分57秒 | Weblog
ISC12における SDPARA に関する展示内容です。




コメント
この記事をはてなブックマークに追加

The 4th Graph500 List in ISC12

2012年06月19日 15時10分24秒 | Weblog
ISC12 で発表となった The 4th Graph500 List。一部に間違い等があり、TSUBMAE2.0 (CPU版)が 10位となる予定。

国別の参加エントリー数


○当CREST における結果
TSUBAME2.0 (GPU版):世界4位


東大 FX10 : 世界3位



BoF 3: Fourth Graph500 List
June 19, 2012, 11:30 AM - 12:15 PM
Hall C2.1, CCH - Congress Center Hamburg
David A. Bader, Georgia Institute of Technology
Torsten Hoefler, University of Illinois at Urbana-Champaign
Andrew Lumsdaine, Indiana University & Pervasive Technology Institute
Richard Murphy, Sandia National Laboratories
Marc Snir, University of Illinois & Argonne National Laboratory
コメント
この記事をはてなブックマークに追加

ISC 12 参加中

2012年06月18日 00時17分58秒 | Weblog
現在、ドイツのハンブルグで開催されている ISC 12 に参加しています。Graph500 関係の発表もありますが(IBM BG/Q あたりがどれだけのTEPS 値を出すかに注目)、東工大(Tokyo Institute of Technology)のブースで SDPARA に関する研究展示も行う予定です。

名称 ISC'12 (International Supercomputing Conference)
日程 2012年6月17日日曜日 ~ 6月21日木曜日
場所 Hamburg, Germany (ドイツ、ハンブルグ)
会場 CCH-Congress Center Hamburg

BoF 3: Fourth Graph500 List
June 19, 2012, 11:30 AM - 12:15 PM
Hall C2.1, CCH - Congress Center Hamburg
David A. Bader, Georgia Institute of Technology
Torsten Hoefler, University of Illinois at Urbana-Champaign
Andrew Lumsdaine, Indiana University & Pervasive Technology Institute
Richard Murphy, Sandia National Laboratories
Marc Snir, University of Illinois & Argonne National Laboratory
コメント
この記事をはてなブックマークに追加

RAMP シンポジウムとイノベーション・ジャパン2012

2012年06月17日 15時11分37秒 | Weblog
例年イノベーション・ジャパンに参加しておりましたが、今年は残念ながら RAMP シンポジウムと完全に重なってしまったので、イノベーション・ジャパン 2012 への参加は見送りました。

------------------------------------------------------------------
RAMPシンポジウムは,日本オペレーションズ・リサーチ学会の数理計画研究部会
(RAMP: Research Association of Mathematical Programming) によって
年一度開催される,最適化・数理計画に関するシンポジウムです.


日本オペレーションズ・リサーチ学会 RAMP シンポジウム

日時 : 2012年9月27日(木),28日(金)
会場 : 東北大学 片平キャンパス さくらホール
(JR仙台駅から徒歩20分程度)

------------------------------------------------------------------

イノベーション・ジャパン2012-大学見本市 開催概要

日時 :
2012年9月27日(木) 9:30~17:30
   9月28日(金)10:00~17:00
会 場
東京国際フォーラム(東京都千代田区丸の内3丁目5番1号)
主 催
独立行政法人 科学技術振興機構
入場料
無料
コメント
この記事をはてなブックマークに追加

GTC Japan 2012

2012年06月16日 00時04分49秒 | Weblog
今年も7月に東京ミッドタウンホール&カンファレンスで GTC Japan 2012 が 7/26 に開催されます。現在、事前登録の受付中です。ポスター発表も受け付けています。

タイトル: GTC Japan 2012
主催: エヌビディア ジャパン
会期: 2012年7月26日(木)10:00開場(9:30~受付)
申込: 無料 (※Webサイトからの事前登録制)
会場: 東京ミッドタウンホール&カンファレンス (六本木)
コメント
この記事をはてなブックマークに追加