最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

日本オペレーションズ・リサーチ学会 2014年春季研究発表会 発表締切り

2013年12月31日 02時37分16秒 | Weblog
日本オペレーションズ・リサーチ学会 2014年春季研究発表会の発表申込みの締切りは今日です(12月31日)。
2013年12月1日(日)~12月31日(火)
・発表時間は20分と30分から選択できます.
・事例発表の場合は,予稿集に掲載のアブストラクトなしでの発表も可能です.
コメント
この記事をはてなブックマークに追加

移動準備

2013年12月30日 00時26分15秒 | Weblog
とりあえず第1陣として以下のサーバ(11台)を想定しています。

◯グラフ&データ解析サーバ等

上から
1: SandyBridge-EP マシン:Intel Xeon E5-2650 2.00GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.5

2: SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.5

3: SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
SDD Fusion IO 1.2TB SSD Card 1.2TB x 1
SSD SATA SSD 600GB x 3
HDD Enterprize 3.5" 3TB SATA HDD 3TB x 1
OS : CentOS 6.5

4: SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.5

5: Westmere-EX 40 コアマシン
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
OS : CentOS 6.5

これ以外で2台(写真には入っていない)

6: SandyBridge-EP 32コアマシン
CIntel Xeon E5-4650 2.70GHz : 8 Core 20M L3 cache x 4
Memory DDR 3 1600 ECC REG 512GB (16GB x 32)
SSD : Intel SSD 910, SSD 520
OS : CentOS 6.5

7: AMD Opeteron 64(32)コアマシン
CPU : AMD Opteron 6386 2.8GHz x 4 個
メモリ : 1TB (32GB x 32枚)
OS: CentOS 6.5

◯GPU 計算クラスタ


Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

ZOTAC Tegra Note 7

2013年12月29日 00時52分08秒 | Weblog
ZOTAC Tegra Note 7 では CPU/GPU として NVIDIA Tegra4 を搭載されている。このタブレットで Graph500 を実行してみると以下の通りで、NEXUS 7 (2013) 程度の性能になっている。

SCALE18 (4threads)
min_TEPS: 3.45598972113439739e+07
firstquartile_TEPS: 3.75538770337997496e+08
median_TEPS: 5.62107498598051310e+08
thirdquartile_TEPS: 7.43533988029489398e+08
max_TEPS: 8.90686818778593540e+08

NVIDIA,「Tegra Note 7」のAndroid 4.3アップデートを提供。Always-On HDR撮影機能の実装もトピック
コメント
この記事をはてなブックマークに追加

TSUBAME-KFC 上での SDPARA その2

2013年12月28日 00時07分42秒 | Weblog
先日の TSUBAME-KFC での数値実験の続き。TSUBAME-KFC 全40ノード (160GPU)を用いた実験結果。最大で約 71.78TFlops となっている。

◯ ソフトウェア SDPARA 7.6.0-G

○tai29a
[gpdpotrf] ### END n=330513, nb=1024, 10x16 procs, ver 40: 205.504591sec --> 58562.937854GFlops ###
[gpdpotrf] ### END n=330513, nb=2048, 10x16 procs, ver 40: 192.252110sec --> 62599.846579GFlops ###

○tai30a
[gpdpotrf] ### END n=379350, nb=2048, 10x16 procs, ver 40: 253.520454sec --> 71777.116375GFlops ###

TSUBAME-KFC - LX 1U-4GPU/104Re-1G Cluster, Intel Xeon E5-2620v2 6C 2.100GHz, Infiniband FDR, NVIDIA K20x

コメント
この記事をはてなブックマークに追加

停電による研究室サーバ停止 その2

2013年12月27日 00時59分42秒 | Weblog
以下のように現在は全サーバが停止中です。27日の昼過ぎには全てを起動する予定です。

------------------------------------------------------------------------------------------------------------------
おおよそ以下の期間ですが、全館停電による点検作業のため、研究室の全サーバ(メールや Web サーバを含む)が停止します。

2013年12月25日(水)16:00 ~ 2013年12月27日(金)14:00
コメント
この記事をはてなブックマークに追加

Extrelemy Large-scale Parallel Cholesky Solver

2013年12月26日 00時27分35秒 | Weblog
SDPARA 用の以下の超並列 Cholesky Solver の研究で春の OR 学会でも発表しようと思っています。
以下の環境(4ノード, 16GPU)で 228655 x 286552 の行列の Cholesky 分解の性能について:

◯2013年2月 : SDPARA 7.5.0-G & CUDA 4.2
[gpdpotrf] ### END n=286552, nb=1024 took 2746.579950sec --> 2855.596440GFlops ###

◯2013年12月 : SDPARA 7.6.0-G & CUDA 5.5
[gpdpotrf] ### END n=286552, nb=2048, 4x4 procs, ver 40: 2075.325595sec --> 3779.225749GFlops ###




◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

GPU クラスタと CUDA 5.5

2013年12月25日 00時20分06秒 | Weblog
こちらの GPU クラスタに CUDA 5.5 をインストールして動作チェックを行っていますが、今のところ正常に動作しています。

> nvidia-smi
Wed Dec 25 00:16:59 2013
+------------------------------------------------------+
| NVIDIA-SMI 5.319.37 Driver Version: 319.37 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla C2075 On | 0000:02:00.0 On | 0 |
| 34% 83C P0 87W / N/A | 5336MB / 5375MB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 Tesla C2075 On | 0000:03:00.0 Off | 0 |
| 30% 78C P0 81W / N/A | 5316MB / 5375MB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 2 Tesla C2075 On | 0000:83:00.0 Off | 0 |
| 30% 82C P0 80W / N/A | 5316MB / 5375MB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 3 Tesla C2075 On | 0000:84:00.0 Off | 0 |
| 38% 85C P0 95W / N/A | 5315MB / 5375MB | 0% Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Compute processes: GPU Memory |
| GPU PID Process name Usage |
|=============================================================================|
| 0 8374 ./sdpara 5181MB |
| 1 8375 ./sdpara 5181MB |
| 2 8376 ./sdpara 5181MB |
| 3 8377 ./sdpara 5181MB |
+-----------------------------------------------------------------------------+



◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64
コメント
この記事をはてなブックマークに追加

メモリ 1TB 新マシン その4

2013年12月24日 00時28分54秒 | Weblog
BLAS に関してですが、Xeon の方は MKL の方が速く、Opteron の方は OpenBLAS の方が速いので、お互い速い方で比較してみました。前回は Xeon の方がはるかに速かったのですが、以下のように量子化学系の問題ですと両者の差はほとんどありません。

○ BLAS ライブラリ
Intel MKL 11.1 update1
OpenBLAS 0.2.8

◯ SDPA 7.4.0

問題 Be.1S.SV.pqgt1t2p.dat-s
サーバ1 : 441.73s
サーバ2 : 459.07s

問題 NH.3Sigma-.DZ.pqgt1t2p.dat-s
サーバ1:10681.32s
サーバ2:10607.44s

◯計算サーバ1
SandyBridge-EP マシン:Intel Xeon E5-4650 2.70GHz : 8 Core 20M L3 cache x 4
Memory DDR 3 1600 ECC REG 512GB (16GB x 32)
OS : CentOS 6.5

◯計算サーバ2
CPU : AMD Opteron 6386 2.8GHz x 4 個
メモリ : 1TB (32GB x 32枚)
OS: CentOS 6.5
コメント
この記事をはてなブックマークに追加

停電による研究室サーバ停止

2013年12月23日 03時07分03秒 | Weblog
おおよそ以下の期間ですが、全館停電による点検作業のため、研究室の全サーバ(メールや Web サーバを含む)が停止します。

2013年12月25日(水)16:00 ~ 2013年12月27日(金)14:00
コメント
この記事をはてなブックマークに追加

日本オペレーションズ・リサーチ学会 2014年春季研究発表会

2013年12月22日 02時35分12秒 | Weblog
日本オペレーションズ・リサーチ学会 2014年春季研究発表会の発表申込みの締切りがもうすぐです。

2013年12月1日(日)~12月31日(火)
・発表時間は20分と30分から選択できます.
・事例発表の場合は,予稿集に掲載のアブストラクトなしでの発表も可能です.
コメント
この記事をはてなブックマークに追加

The Japanese Extreme Big Data Projects Workshop

2013年12月21日 03時29分46秒 | Weblog
The Japanese Extreme Big Data Projects Workshop

Hotel Monterey La Soeur Fukuoka, Fukuoka JAPAN, Feb 26, 2014

Overview

We plan to host an international workshop in Fukuoka, Japan on Feb. 26th to present in an open forum recent Japanese Extreme Computing Big Data projects. The purpose is to introduce seven major existing projects to leading researchers of HPC and Big Data from U.S, Europe, China and Japan, who will join the upcoming BDEC Meeting (Big Data and Extreme-Scale Computing) on the following days. Prior to their interdisciplinary and strategic discussions, this BDEC pre-workshop aims to deepen mutual understanding in the relevant scientific fields. Attendance will be open to the registered public.
コメント
この記事をはてなブックマークに追加

HPCS 2014 事前参加申込期間

2013年12月20日 01時21分06秒 | Weblog
ただいま参加登録受付中です.事前参加申込期間は12月24日(火)までです.

こちらの参加申込方法をご覧の上,参加申込書(申込ページ)からお申し込みください.懇親会への参加を希望する方は参加申込ページの懇親会出欠欄にチェックをお願いします.懇親会費は当日現金でお支払い下さい.

コメント
この記事をはてなブックマークに追加

TSUBAME-KFC 上での SDPARA

2013年12月19日 02時03分54秒 | Weblog
TSUBAME-KFC 全40ノード (160GPU)を用いて SDPARA の実験を行っている。まずは、自分のホームディレクトリに Intel Compiler 14.0.1 (MKL 11.1) と mvapich 1.8.1 をインストールするところから始めたので、SDPARA の実行までに結構な時間を要した。現時点では 58.2TFlops ぐらいの性能になっている。

◯ ソフトウェア SDPARA 7.6.0-G

◯tai28a
[gpdpotrf] ### END n=286552, nb=1024, 10x16 procs, ver 40: 144.519966sec --> 54270.175513GFlops ###
[gpdpotrf] ### END n=286552, nb=2048, 10x16 procs, ver 40: 161.749685sec --> 48489.268615GFlops ###

◯tai29a
[gpdpotrf] ### END n=330513, nb=1024, 10x16 procs, ver 40: 206.502790sec --> 58279.854680GFlops ###


TSUBAME-KFC - LX 1U-4GPU/104Re-1G Cluster, Intel Xeon E5-2620v2 6C 2.100GHz, Infiniband FDR, NVIDIA K20x

コメント
この記事をはてなブックマークに追加

Tegra Note 7

2013年12月18日 01時27分15秒 | Weblog
7月に開催された NVIDIA GTC Japan 2013 で最優秀ポスター賞を頂きました。賞品の目録に Tegra タブレットと書いてありますが、やっと賞品 (Tegra Note 7)が送られてきました。








国内発売が決まったNVIDIA純正タブレット「Tegra Note 7」を試す
コメント
この記事をはてなブックマークに追加

正定対称行列をめぐるモデリング・数理・アルゴリズムの世界

2013年12月17日 01時49分06秒 | Weblog
以下の文部科学省数学協働プログラムワークショップ「正定対称行列をめぐるモデリング・数理・アルゴリズムの世界」 ですが、いよいよプログラムとアブストラクトが公開となりました。

日時:2014年1月14日(火)、15日(水)
場所:政策研究大学院大学 想海楼ホール (〒106-0047 港区六本木7の22の1; 六本木駅および乃木坂駅より7分)
講演者(2013年12月16日(確定版)):

プログラム(12月16日)
講演アブストラクト (12月16日)
コメント
この記事をはてなブックマークに追加