2013年12月のブログ記事一覧-最適化問題に対する超高速＆安定計算

日本オペレーションズ・リサーチ学会　2014年春季研究発表会　発表締切り

2013年12月31日 02時37分16秒 | Weblog

日本オペレーションズ・リサーチ学会 2014年春季研究発表会の発表申込みの締切りは今日です（１２月３１日）。
2013年12月1日(日)～12月31日（火）
・発表時間は20分と30分から選択できます．
・事例発表の場合は，予稿集に掲載のアブストラクトなしでの発表も可能です．

移動準備

2013年12月30日 00時26分15秒 | Weblog

とりあえず第１陣として以下のサーバ（１１台）を想定しています。

◯グラフ&データ解析サーバ等

上から
1: SandyBridge-EP マシン：Intel Xeon E5-2650 2.00GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.5

2: SandyBridge-EP マシン：Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.5

3: SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
SDD Fusion IO 1.2TB SSD Card 1.2TB x 1
SSD SATA SSD 600GB x 3
HDD Enterprize 3.5" 3TB SATA HDD 3TB x 1
OS : CentOS 6.5

4: SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.5

5: Westmere-EX 40 コアマシン
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
OS : CentOS 6.5

これ以外で２台（写真には入っていない）

6: SandyBridge-EP 32コアマシン
CIntel Xeon E5-4650 2.70GHz : 8 Core 20M L3 cache x 4
Memory DDR 3 1600 ECC REG 512GB (16GB x 32)
SSD : Intel SSD 910, SSD 520
OS : CentOS 6.5

7: AMD Opeteron 64(32)コアマシン
CPU : AMD Opteron 6386 2.8GHz x 4 個
メモリ : 1TB (32GB x 32枚)
OS: CentOS 6.5

◯GPU 計算クラスタ

Intel Xeon + 4 GPU マシン（４台）
CPU：Xeon X5690(3.46GHz,6コア)×2
メモリ：192GB(16GB×12)
HDD：SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU：Tesla C2075(C2070)×4
OS：CentOS 6.3 for x86_64

ZOTAC Tegra Note 7

2013年12月29日 00時52分08秒 | Weblog

ZOTAC Tegra Note 7 では CPU/GPU として NVIDIA Tegra4 を搭載されている。このタブレットで Graph500 を実行してみると以下の通りで、NEXUS 7 (2013) 程度の性能になっている。

SCALE18 (4threads)
min_TEPS: 3.45598972113439739e+07
firstquartile_TEPS: 3.75538770337997496e+08
median_TEPS: 5.62107498598051310e+08
thirdquartile_TEPS: 7.43533988029489398e+08
max_TEPS: 8.90686818778593540e+08

NVIDIA，「Tegra Note 7」のAndroid 4.3アップデートを提供。Always-On HDR撮影機能の実装もトピック

TSUBAME-KFC 上での SDPARA その２

2013年12月28日 00時07分42秒 | Weblog

先日の TSUBAME-KFC での数値実験の続き。TSUBAME-KFC 全４０ノード (１６０GPU)を用いた実験結果。最大で約 71.78TFlops となっている。

◯ ソフトウェア SDPARA 7.6.0-G

○tai29a
[gpdpotrf] ### END n=330513, nb=1024, 10x16 procs, ver 40: 205.504591sec --> 58562.937854GFlops ###
[gpdpotrf] ### END n=330513, nb=2048, 10x16 procs, ver 40: 192.252110sec --> 62599.846579GFlops ###

○tai30a
[gpdpotrf] ### END n=379350, nb=2048, 10x16 procs, ver 40: 253.520454sec --> 71777.116375GFlops ###

TSUBAME-KFC - LX 1U-4GPU/104Re-1G Cluster, Intel Xeon E5-2620v2 6C 2.100GHz, Infiniband FDR, NVIDIA K20x

停電による研究室サーバ停止　その２

2013年12月27日 00時59分42秒 | Weblog

以下のように現在は全サーバが停止中です。２７日の昼過ぎには全てを起動する予定です。

------------------------------------------------------------------------------------------------------------------
おおよそ以下の期間ですが、全館停電による点検作業のため、研究室の全サーバ（メールや Web サーバを含む）が停止します。

2013年12月25日(水)16:00 ～ 2013年12月27日(金)14:00

Extrelemy Large-scale Parallel Cholesky Solver

2013年12月26日 00時27分35秒 | Weblog

SDPARA 用の以下の超並列 Cholesky Solver の研究で春の OR 学会でも発表しようと思っています。
以下の環境(4ノード, 16GPU)で 228655 x 286552 の行列の Cholesky 分解の性能について：

◯2013年2月 : SDPARA 7.5.0-G & CUDA 4.2
[gpdpotrf] ### END n=286552, nb=1024 took 2746.579950sec --> 2855.596440GFlops ###

◯2013年12月 : SDPARA 7.6.0-G & CUDA 5.5
[gpdpotrf] ### END n=286552, nb=2048, 4x4 procs, ver 40: 2075.325595sec --> 3779.225749GFlops ###

◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン（４台）
CPU：Xeon X5690(3.46GHz,6コア)×2
メモリ：192GB(16GB×12)
HDD：SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU：Tesla C2075(C2070)×4
OS：CentOS 6.3 for x86_64

GPU クラスタと CUDA 5.5

2013年12月25日 00時20分06秒 | Weblog

◯最適化問題(SDP)用 GPU 計算クラスタ
Intel Xeon + 4 GPU マシン（４台）
CPU：Xeon X5690(3.46GHz,6コア)×2
メモリ：192GB(16GB×12)
HDD：SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU：Tesla C2075(C2070)×4
OS：CentOS 6.3 for x86_64

メモリ 1TB 新マシン　その４

2013年12月24日 00時28分54秒 | Weblog

BLAS に関してですが、Xeon の方は MKL の方が速く、Opteron の方は OpenBLAS の方が速いので、お互い速い方で比較してみました。前回は Xeon の方がはるかに速かったのですが、以下のように量子化学系の問題ですと両者の差はほとんどありません。

○ BLAS ライブラリ
Intel MKL 11.1 update1
OpenBLAS 0.2.8

◯ SDPA 7.4.0

問題 Be.1S.SV.pqgt1t2p.dat-s
サーバ１ : 441.73s
サーバ２ : 459.07s

問題 NH.3Sigma-.DZ.pqgt1t2p.dat-s
サーバ１：10681.32s
サーバ２：10607.44s

◯計算サーバ１
SandyBridge-EP マシン：Intel Xeon E5-4650 2.70GHz : 8 Core 20M L3 cache x 4
Memory DDR 3 1600 ECC REG 512GB (16GB x 32)
OS : CentOS 6.5

◯計算サーバ２
CPU : AMD Opteron 6386 2.8GHz x 4 個
メモリ : 1TB (32GB x 32枚)
OS: CentOS 6.5

停電による研究室サーバ停止

2013年12月23日 03時07分03秒 | Weblog

おおよそ以下の期間ですが、全館停電による点検作業のため、研究室の全サーバ（メールや Web サーバを含む）が停止します。

2013年12月25日(水)16:00 ～ 2013年12月27日(金)14:00

日本オペレーションズ・リサーチ学会　2014年春季研究発表会

2013年12月22日 02時35分12秒 | Weblog

日本オペレーションズ・リサーチ学会 2014年春季研究発表会の発表申込みの締切りがもうすぐです。

2013年12月1日(日)～12月31日（火）
・発表時間は20分と30分から選択できます．
・事例発表の場合は，予稿集に掲載のアブストラクトなしでの発表も可能です．

The Japanese Extreme Big Data Projects Workshop

2013年12月21日 03時29分46秒 | Weblog

The Japanese Extreme Big Data Projects Workshop

Hotel Monterey La Soeur Fukuoka, Fukuoka JAPAN, Feb 26, 2014

Overview

We plan to host an international workshop in Fukuoka, Japan on Feb. 26th to present in an open forum recent Japanese Extreme Computing Big Data projects. The purpose is to introduce seven major existing projects to leading researchers of HPC and Big Data from U.S, Europe, China and Japan, who will join the upcoming BDEC Meeting (Big Data and Extreme-Scale Computing) on the following days. Prior to their interdisciplinary and strategic discussions, this BDEC pre-workshop aims to deepen mutual understanding in the relevant scientific fields. Attendance will be open to the registered public.

HPCS 2014 事前参加申込期間

2013年12月20日 01時21分06秒 | Weblog

ただいま参加登録受付中です．事前参加申込期間は12月24日（火）までです．

こちらの参加申込方法をご覧の上，参加申込書（申込ページ）からお申し込みください．懇親会への参加を希望する方は参加申込ページの懇親会出欠欄にチェックをお願いします．懇親会費は当日現金でお支払い下さい．

TSUBAME-KFC 上での SDPARA

2013年12月19日 02時03分54秒 | Weblog

TSUBAME-KFC 全４０ノード (１６０GPU)を用いて SDPARA の実験を行っている。まずは、自分のホームディレクトリに Intel Compiler 14.0.1 (MKL 11.1) と mvapich 1.8.1 をインストールするところから始めたので、SDPARA の実行までに結構な時間を要した。現時点では 58.2TFlops ぐらいの性能になっている。

◯ ソフトウェア SDPARA 7.6.0-G

◯tai28a
[gpdpotrf] ### END n=286552, nb=1024, 10x16 procs, ver 40: 144.519966sec --> 54270.175513GFlops ###
[gpdpotrf] ### END n=286552, nb=2048, 10x16 procs, ver 40: 161.749685sec --> 48489.268615GFlops ###

◯tai29a
[gpdpotrf] ### END n=330513, nb=1024, 10x16 procs, ver 40: 206.502790sec --> 58279.854680GFlops ###

TSUBAME-KFC - LX 1U-4GPU/104Re-1G Cluster, Intel Xeon E5-2620v2 6C 2.100GHz, Infiniband FDR, NVIDIA K20x

Tegra Note 7

2013年12月18日 01時27分15秒 | Weblog

７月に開催された NVIDIA GTC Japan 2013 で最優秀ポスター賞を頂きました。賞品の目録に Tegra タブレットと書いてありますが、やっと賞品 (Tegra Note 7)が送られてきました。

国内発売が決まったNVIDIA純正タブレット「Tegra Note 7」を試す

正定対称行列をめぐるモデリング・数理・アルゴリズムの世界

2013年12月17日 01時49分06秒 | Weblog

以下の文部科学省数学協働プログラムワークショップ「正定対称行列をめぐるモデリング・数理・アルゴリズムの世界」ですが、いよいよプログラムとアブストラクトが公開となりました。

日時：２０１４年１月１４日(火)、１５日（水）
場所：政策研究大学院大学想海楼ホール (〒106-0047 港区六本木７の２２の１; 六本木駅および乃木坂駅より7分)
講演者（2013年12月16日(確定版)）：

プログラム(12月16日)
講演アブストラクト (12月16日)

アクセス
閲覧	224	PV
訪問者	179	IP
トータル
閲覧	4,997,823	PV
訪問者	1,258,642	IP

	goo blogは20周年を迎えました！
	訪問者数に応じてdポイント最大1,000pt当たる！
	皆さんにおすすめしたい人気ブログをご紹介
	今週のお題「#ガーデニング」をチェック

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心