最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

HPGP' 16

2016年05月31日 01時42分35秒 | Weblog
今日開催です。。。

HPGP'16


Latest News

The workshop programme has been announced.
Registration instructions for HPGP'16 are available from HPDC'16 conference registration page.

About HPGP

The High Performance Graph Processing (HPGP) 2016 workshop will be the first in a series of workshops organized on large graph data management and mining on high performance computing systems. The workshop will be held on 31st May 2016, at Kyoto, Japan co-located with the ACM International Symposium on High-Performance Parallel and Distributed Computing (HPDC) 2016. HPGP'16 will be a half-day workshop.


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Linpack : Xeon と Xeon Phi

2016年05月30日 01時58分01秒 | Weblog
◯計算サーバ
CPU : Intel(R) Xeon(R) CPU E5-2670 v3 @ 2.30GHz x 2
メモリ:512GB
アクセラレータ:Intel Xeon Phi
OS : CentOS 7.2

◯CPU :
time ./runme_xeon64
This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
2016年 5月 29日 日曜日 21:42:12 JST
Intel(R) Optimized LINPACK Benchmark data

Current date/time: Sun May 29 21:42:12 2016

CPU frequency: 3.099 GHz
Number of CPUs: 2
Number of cores: 24
Number of threads: 24

Performance Summary (GFlops)

Size LDA Align. Average Maximal
1000 1000 4 105.7174 125.2738
2000 2000 4 288.8508 316.4528
5000 5008 4 575.2693 580.2627
10000 10000 4 735.1371 736.6474
15000 15000 4 748.2649 748.5248
18000 18008 4 770.3632 770.9929
20000 20016 4 774.1154 774.7422
22000 22008 4 769.9605 770.2098
25000 25000 4 773.2758 773.3150
26000 26000 4 775.3615 775.4599
27000 27000 4 779.4964 779.4964
30000 30000 1 780.5364 780.5364
35000 35000 1 787.6609 787.6609
40000 40000 1 793.4843 793.4843
45000 45000 1 786.9196 786.9196


◯ アクセラレータ:
time ./runme_mic
This is a SAMPLE run script for SMP LINPACK. Change it to reflect
the correct number of CPUs/threads, problem input files, etc..
Sun May 29 21:31:46 JST 2016
Intel(R) Optimized LINPACK Benchmark data

Current date/time: Sun May 29 21:31:46 2016

CPU frequency: 1.238 GHz
Number of CPUs: 1
Number of cores: 244
Number of threads: 244

Performance Summary (GFlops)

Size LDA Align. Average Maximal
2048 2112 4 64.0561 91.5393
4096 6208 4 248.4799 259.0791
6144 6208 4 389.8995 397.1151
8192 8256 4 481.0933 485.3415
10240 10304 4 565.7881 576.0193
12288 12352 4 627.6521 631.1250
14336 14400 4 701.5417 705.7803
16384 18496 4 734.1335 738.3655
18432 18496 4 778.2477 782.3456
20480 20544 4 809.3222 812.1281
22528 22592 4 839.6349 841.6996
24576 26688 4 860.3620 862.2219
26624 26688 4 877.4989 879.6877
28672 28736 4 891.0177 891.1374
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新ファイルサーバ:稼働開始 その4

2016年05月29日 01時29分59秒 | Weblog




ソフトウェア SDPA 7.4.0

◯オプション1
export CFLAGS="-O2 -qopenmp"
export CXXFLAGS="-O2 -qopenmp"
export FFLAGS="-O2 -i8 -qopenmp"

◯オプション2
export CFLAGS="-O3 -qopenmp -parallel -xHOST "
export CXXFLAGS="-O3 -qopenmp -parallel -xHOST "
export FFLAGS="-O3 -i8 -qopenmp -parallel -xHOST "

◯問題1:karate.dat-s
icc 16.0.3 + Intel MKL 11.3.3
オプション1:96.71s
オプション2:90.49s
参考
gcc 4.8.5 + OpenBLAS 0.2.19 : 113.16s


◯問題2:DSJC500.9.dat-s
icc 16.0.3 + Intel MKL 11.3.3
オプション1:30.17s
オプション2:31.41s
参考
gcc 4.8.5 + OpenBLAS 0.2.19 : 36.62s


◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
icc 16.0.3 + Intel MKL 11.3.3
オプション1:109.74s
オプション2:107.95s
参考
gcc 4.8.5 + OpenBLAS 0.2.19 : 110.29s
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

6月 IMI Colloquium

2016年05月28日 01時00分01秒 | Weblog
6月 IMI Colloquium

日時:2016年6月8日(水)
16:45-17:45

場所:九州大学 マス・フォア・インダストリ研究所 ウエスト1号館 4階
IMIオーディトリアム(W1-D-413)(円形階段教室)

講師:橋詰 富博 氏 (日立製作所研究開発グループ)

講演タイトル:Scanning non-linear optical probe microscopy utilizing tip-enhanced near field optics

講演要旨:
Surfaces and interfaces among thin films of metals, metal oxides, water solutions, and organic materials are getting more and more important, recently, because of interesting scientific findings and important industrial applications. Investigating light-material interactions at a hetero interface is important also to understand physics of the materials for quantum devices. High spacial resolutions of scanning probe microscopy (SPM) enabled identifying properties of the materials interfaces that had not been otherwise accessible. In this work, we describe a novel SPM to observe non-linear optical properties of the interfaces at a 10 nm level spacial resolution.
We utilize sum-frequency generation (SFG), one of the second-order nonlinear optical processes which give signal intensity only where the spacial symmetry is broken. For example, we can investigate a 1.5 nm thick hydration structure of the water interface using SFG spectroscopy [1]. However, the spatial resolution of the traditional SFG microscopy (1 μm) is not enough for measuring nanometer-scale interface properties. Therefore, we combined SFG with SPM utilizing tip-enhanced near field optics [2].
We examined a gold thin film surface in air and measured the topography of the surface and SFG intensity of water molecules adsorbed on the surface. We observed local peaks of the SFG intensity where the topography showed local troughs. The results can be understood by a gold surface model with contaminations which give higher topographic height and lower SFG signal.
[1] Q. Du et al., Phys. Rev. Lett. 72, 238 (1994).
[2] N. Hayazawa, Y. Inouye, Z. Sekkat, and S. Kawata, Opt. Commun. 183, 333 (2000).

This study is a collaboration work with H. Yoshino (Tokyo Institute of Technology), S. Nagata (Hitachi Ltd.), T. Oka(Tokyo Institute of Technology), and S. Heike(Hitachi Ltd.).
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

「CentOS 6.8」リリース

2016年05月27日 00時27分49秒 | Weblog
こちらのサーバも 6.8 に upgrade しました。。。

RHEL 6.8互換の「CentOS 6.8」リリース

Red Hat Enterprise Linux(RHEL)互換のLinuxディストリビューション「CentOS」開発チームは5月25日、「CentOS 6.8」をリリースした。対応アーキテクチャはi386およびx86_64。プロジェクトのWebサイトより入手できる。CentOSはRHELと100%の互換を目指すLinuxディストリビューション。RHELが公開するコードや各種リソースから商標などを削除・置換することで、自由な再配布を実現している。プロジェクトは米Red Hatの支援を受けている。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新ファイルサーバ:性能測定 その3

2016年05月26日 03時23分15秒 | Weblog








> df -H
ファイルシス サイズ 使用 残り 使用% マウント位置
/dev/md126p3 224G 29G 195G 13% /
devtmpfs 271G 0 271G 0% /dev
tmpfs 271G 87k 271G 1% /dev/shm
tmpfs 271G 27M 271G 1% /run
tmpfs 271G 0 271G 0% /sys/fs/cgroup
/dev/nvme0n1p1 1.2T 192M 1.2T 1% /work
/dev/sdc1 8.0T 589G 7.5T 8% /backup
/dev/sdb1 65T 3.6T 61T 6% /data1
/dev/sda1 65T 37M 65T 1% /data0
/dev/md126p1 521M 150M 372M 29% /boot
tmpfs 55G 17k 55G 1% /run/user/42
tmpfs 55G 0 55G 0% /run/user/1001

◯ssd に対するアクセス性能 (/work)

$ /usr/local/bin/bonnie++ -d /work/ -s 512 -r 256
Writing with putc()...done
Writing intelligently...done
Rewriting...done
Reading with getc()...done
Reading intelligently...done
start 'em...done...done...done...
Create files in sequential order...done.
Stat files in sequential order...done.
Delete files in sequential order...done.
Create files in random order...done.
Stat files in random order...done.
Delete files in random order...done.
Version 1.03e ------Sequential Output------ --Sequential Input- --Random-
-Per Chr- --Block-- -Rewrite- -Per Chr- --Block-- --Seeks--
Machine Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP /sec %CP
opt-ds.imi.kyu 512M 143474 99 2255255 99 3559465 99 144183 99 7287542 99 458295 241
------Sequential Create------ --------Random Create--------
-Create-- --Read--- -Delete-- -Create-- --Read--- -Delete--
files /sec %CP /sec %CP /sec %CP /sec %CP /sec %CP /sec %CP
16 39547 99 1499377 99 97563 92 48423 99 +++++ +++ 61391 65
opt-ds.imi.kyushu-u.ac.jp,512M,143474,99,2255255,99,3559465,99,144183,99,7287542,99,458294.8,241,16,39547,99,1499377,99,97563,92,48423,99,+++++,+++,61391,65

◯RAID10 ファイル・システムに関するアクセス性能 (/data0)

$ /usr/local/bin/bonnie++ -d /data0/ -s 512 -r 256
Writing with putc()...done
Writing intelligently...done
Rewriting...done
Reading with getc()...done
Reading intelligently...done
start 'em...done...done...done...
Create files in sequential order...done.
Stat files in sequential order...done.
Delete files in sequential order...done.
Create files in random order...done.
Stat files in random order...done.
Delete files in random order...done.
Version 1.03e ------Sequential Output------ --Sequential Input- --Random-
-Per Chr- --Block-- -Rewrite- -Per Chr- --Block-- --Seeks--
Machine Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP /sec %CP
opt-ds.imi.kyu 512M 144864 99 2178939 99 3429431 99 143764 99 6856477 99 778268 252
------Sequential Create------ --------Random Create--------
-Create-- --Read--- -Delete-- -Create-- --Read--- -Delete--
files /sec %CP /sec %CP /sec %CP /sec %CP /sec %CP /sec %CP
16 41241 99 1478156 99 106215 99 43384 99 +++++ +++ 104675 99
opt-ds.imi.kyushu-u.ac.jp,512M,144864,99,2178939,99,3429431,99,143764,99,6856477,99,778267.6,252,16,41241,99,1478156,99,106215,99,43384,99,+++++,+++,104675,99
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Intel Xeon Phi オフロード

2016年05月25日 01時13分49秒 | Weblog
以下はネットで見つけたサンプルコードですが、 こちらの Xeon Phi マシンでオフロード計算出来ました。。。

#include<stdio.h>
#include<stdlib.h>
#define INTERVALS 1000000000

int main( void )
{
int i;
double x;
double pi = 0.0;
double step = 1.0 / INTERVALS;

#pragma offload target(mic)
#pragma omp parallel for private(x) reduction(+:pi)
for( i=0; i<INTERVALS; i++)
{
x = step * ((double)i - 0.5 );
pi += 4.0 / (1.0 + x * x );
}

pi = step * pi;
printf( "PI = %lfn", pi );

return 0;
}


./sample_offload
[Offload] [MIC 0] [File] sample_offload.c
[Offload] [MIC 0] [Line] 12
[Offload] [MIC 0] [Tag] Tag 0
[Offload] [HOST] [Tag 0] [CPU Time] 0.665600(seconds)
[Offload] [MIC 0] [Tag 0] [CPU->MIC Data] 36 (bytes)
[Offload] [MIC 0] [Tag 0] [MIC Time] 0.245841(seconds)
[Offload] [MIC 0] [Tag 0] [MIC->CPU Data] 36 (bytes)

PI = 3.141593

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

伊都キャンパス 中央図書館

2016年05月24日 00時56分09秒 | Weblog
伊都キャンパス中央図書館(工事中です)。






コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

マス・フォア・インダストリ研究所学術研究員(ポスドク)1名公募:締め切り6月30日

2016年05月23日 02時28分17秒 | Weblog
マス・フォア・インダストリ研究所学術研究員(ポスドク)1名公募:延長

※ 平成28年4月12日付公募(応募期限4月28日)の,応募期限を延長します.
1. 公募対象:マス・フォア・インダストリ研究所 学術研究員(ポスドク) 1名

2. 専門分野:広い意味での統計科学,機械学習,最適化,グラフ解析,ゲーム理論,確率論,および関連分野

3. 研究内容:九州大学では,JST COIプログラムによる「共進化社会システム創成拠点」の研究プロジェクトを推進しています.この中でマス・フォア・インダストリ研究所(IMI)は,産業数学ユニットとして,数学・数理科学の手法を駆使した研究により拠点の研究活動に貢献しています.採用者の方には,共進化社会システム創成拠点の産業数学ユニットに所属していただき,主に以下の研究・業務に携わっていただきます.
(1) 各種センサーから得られたビッグデータに対する統計的モデリング
(2) グラフ解析に基づく最適化
(3) 計算機サーバの管理業務

4.任期:平成30年3月31日まで.期間満了後,1年毎の契約更新の可能性あり(最長3年).

5. 応募資格:博士の学位を有し(採用時までに取得見込みを含む),上記の研究内容に意欲的であり,本研究課題の関係者と十分なコミュニケーションができる方.スパースモデリングやデータ同化など,機械学習・最適化の分野と関わる統計的手法に興味のある方.また,実際に大規模な実データを解析する意欲のある方.

6. 採用予定日:採用決定後,できるだけ早い時期.

7. 待遇:九州大学の規定に従い年齢や業績により決定する.

8. 提出書類: (1)履歴書(写真貼付) (2)研究業績リスト(論文,招待講演,受賞等) (3)主要な研究業績の説明および上記の仕事内容に対する抱負 (4)応募者について問い合わせることのできる方3名の氏名,所属,連絡先 (5)主要な学術論文別刷り5編以内(コピー可) (6) その他,必要と思われるもの

9. 応募期限:平成28年6月30日(木)正午必着でお送り下さい. ※ 決定次第,応募期限前でも早期終了します.

10. 書類提出先および問い合わせ先: 〒819-0395 福岡市西区元岡744 九州大学マス・フォア・インダストリ研究所 佐伯修 宛 (e-mail: saeki@imi.kyushu-u.ac.jp) 書類は封筒に「COI学術研究員応募書類在中」と朱書し,簡易書留で郵送して下さい. 応募書類は返却致しませんが,選考終了後に廃棄致します.

11. 選考内容(選考方法,採否の決定),結果通知方法:応募書類による一次審
査ののち,必要に応じて面接・プレゼンテーションを行います.面接日時等詳細については後日対象者に連絡します.

12. その他:九州大学では男女雇用機会均等法の精神を尊重しています.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

5月 臨時 IMI Colloquium

2016年05月22日 03時39分32秒 | Weblog
5月 臨時 IMI Colloquium

日時:2016年5月24日(火)
16:30-17:30

場所:九州大学 マス・フォア・インダストリ研究所 ウエスト1号館 4階
IMIオーディトリアム(W1-D-413)(円形階段教室)

講師:Yuliy Baryshnikov 教授 (イリノイ大学)

講演タイトル:On exotic configuration spaces.

講演要旨:
Configuration spaces - in topology - are formed by tuples of pairwise distinct points in a topological space. They appeared in mechanics, and became a staple in algebraic topology. Their exotic versions - e.g. ones where the only k-collisions are forbidden, or those where the points can be of different "colors" - appeared extremely useful, also outside of topology proper, say in theoretical computer sciences, or theoretical robotics.

I will survey some old and new results in the area.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新ファイルサーバ:性能測定 その2

2016年05月21日 01時16分43秒 | Weblog




ディスクアクセス性能に関しては、 高速 SSD との性能差も少ない。

/usr/local/bin/bonnie++ -d /data1/ -s 512 -r 256
Writing with putc()...done
Writing intelligently...done
Rewriting...done
Reading with getc()...done
Reading intelligently...done
start 'em...done...done...done...
Create files in sequential order...done.
Stat files in sequential order...done.
Delete files in sequential order...done.
Create files in random order...done.
Stat files in random order...done.
Delete files in random order...done.
Version 1.03e ------Sequential Output------ --Sequential Input- --Random-
-Per Chr- --Block-- -Rewrite- -Per Chr- --Block-- --Seeks--
Machine Size K/sec %CP K/sec %CP K/sec %CP K/sec %CP K/sec %CP /sec %CP
opt-ds.imi.kyu 512M 129952 99 1945380 99 3149709 99 120890 99 5713871 99 437464 251
------Sequential Create------ --------Random Create--------
-Create-- --Read--- -Delete-- -Create-- --Read--- -Delete--
files /sec %CP /sec %CP /sec %CP /sec %CP /sec %CP /sec %CP
16 41183 85 +++++ +++ 111093 99 47151 97 +++++ +++ 103086 99
opt-ds.imi.kyushu-u.ac.jp,512M,129952,99,1945380,99,3149709,99,120890,99,5713871,99,437464.0,251,16,41183,85,+++++,+++,111093,99,47151,97,+++++,+++,103086,99
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新ファイルサーバ:性能測定

2016年05月20日 00時11分37秒 | Weblog




ソフトウェア SDPA 7.4.0

◯問題1:karate.dat-s
gcc 4.8.5 + OpenBLAS 0.2.19 : 113.16s

◯問題2:DSJC500.9.dat-s
gcc 4.8.5 + OpenBLAS 0.2.19 : 36.62s

◯問題3:NH3+.2A2\".STO6G.pqgt1t2p.dat-s
gcc 4.8.5 + OpenBLAS 0.2.19 : 110.29s
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新ファイルサーバ:稼働開始

2016年05月19日 01時00分23秒 | Weblog
新ファイルサーバが納品されまして、稼働開始となりました。













コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Moonshot m710 と H2O 問題

2016年05月18日 00時03分37秒 | Weblog
Moonshot m710 で以下の SDP(H2O)問題を解いてみました。180コアで 14304秒ぐらいの実行時間です。

問題名 : H2O.1A1.DZ.pqgt1t2p.dat-s


参考
◯SGI UV2000
CPU : Intel(R) Xeon(R) CPU E5-4650 v2 @ 2.40GHz
メモリ 64TB 搭載

◯320 コア使用時
ELEMENTS : 25269.58秒
CHOLESKY : 3593.60秒
全体:31417.07秒


◯ HP ProLiant m710 サーバーカートリッジ (45カートリッジ)
プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 32GB(4x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 480GB
OS : CentOS 7.2


SDPA start at [Tue May 17 15:54:07 2016]
param is ./param.sdpa
data is /home/fujisawa/data/H2O.1A1.DZ.pqgt1t2p.dat-s : sparse
out is out.H2O
NumNodes is set as 45
NumThreads is set as 4
Schur computation : DENSE
mu thetaP thetaD objP objD alphaP alphaD beta
0 1.0e+04 1.0e+00 1.0e+00 -0.00e+00 -3.68e+05 8.6e-01 1.0e+00 2.00e-01
1 2.0e+03 1.4e-01 8.9e-15 -1.62e+00 -5.54e+05 8.1e-01 8.1e-01 2.00e-01
2 5.3e+02 2.7e-02 1.0e-14 -2.54e+01 -7.10e+05 6.9e-01 6.9e-01 2.00e-01
3 2.2e+02 8.3e-03 1.2e-14 -2.43e+01 -8.09e+05 5.4e-01 1.1e+00 2.00e-01
4 1.2e+02 3.8e-03 1.7e-14 -2.30e+01 -7.38e+05 8.8e-01 1.8e+00 2.00e-01
5 2.5e+01 4.7e-04 2.9e-14 -2.15e+01 -3.23e+05 8.0e-01 1.1e+00 2.00e-01
6 3.7e+00 9.2e-05 2.4e-14 -2.14e+01 -5.27e+04 8.7e-01 1.0e+00 2.00e-01
7 6.3e-01 1.2e-05 6.7e-14 -2.22e+01 -9.40e+03 8.7e-01 1.0e+00 2.00e-01
8 1.2e-01 1.6e-06 6.4e-12 -2.73e+01 -1.78e+03 6.9e-01 8.9e-01 2.00e-01
9 3.5e-02 4.8e-07 7.6e-11 -4.47e+01 -5.64e+02 4.5e-01 7.7e-01 2.00e-01
10 1.5e-02 2.7e-07 4.9e-10 -5.85e+01 -2.69e+02 7.0e-01 5.1e-01 2.00e-01
11 8.2e-03 8.2e-08 9.9e-10 -7.14e+01 -1.94e+02 8.9e-01 8.2e-01 2.00e-01
12 2.7e-03 8.8e-09 1.3e-09 -7.78e+01 -1.20e+02 5.8e-01 7.5e-01 2.00e-01
13 1.1e-03 3.7e-09 4.7e-08 -7.98e+01 -9.71e+01 4.9e-01 5.1e-01 2.00e-01
14 6.7e-04 1.9e-09 2.3e-07 -8.14e+01 -9.17e+01 6.0e-01 3.9e-01 2.00e-01
15 4.2e-04 7.7e-10 7.7e-07 -8.28e+01 -8.94e+01 7.2e-01 3.3e-01 2.00e-01
16 2.7e-04 2.1e-10 3.1e-07 -8.39e+01 -8.81e+01 6.8e-01 4.5e-01 2.00e-01
17 1.6e-04 2.1e-10 3.9e-06 -8.45e+01 -8.70e+01 6.7e-01 4.0e-01 2.00e-01
18 1.0e-04 2.1e-10 3.3e-06 -8.48e+01 -8.64e+01 6.7e-01 3.4e-01 2.00e-01
19 6.6e-05 2.1e-10 2.5e-06 -8.50e+01 -8.61e+01 6.9e-01 3.1e-01 2.00e-01
20 4.5e-05 2.1e-10 1.6e-06 -8.52e+01 -8.59e+01 7.7e-01 3.1e-01 2.00e-01
21 3.1e-05 2.1e-10 1.3e-06 -8.52e+01 -8.57e+01 7.3e-01 4.3e-01 2.00e-01
22 1.9e-05 2.1e-10 7.6e-07 -8.53e+01 -8.56e+01 7.2e-01 3.8e-01 2.00e-01
23 1.3e-05 2.1e-10 4.2e-07 -8.53e+01 -8.55e+01 8.1e-01 3.5e-01 2.00e-01
24 8.5e-06 2.1e-10 2.6e-07 -8.53e+01 -8.55e+01 7.1e-01 4.8e-01 2.00e-01
25 5.1e-06 2.1e-10 1.2e-07 -8.53e+01 -8.54e+01 6.2e-01 3.9e-01 2.00e-01
26 3.4e-06 2.1e-10 8.3e-08 -8.53e+01 -8.54e+01 6.8e-01 3.4e-01 2.00e-01
27 2.4e-06 2.1e-10 5.4e-08 -8.53e+01 -8.54e+01 7.5e-01 4.5e-01 2.00e-01
28 1.5e-06 2.1e-10 3.0e-08 -8.53e+01 -8.54e+01 7.8e-01 4.2e-01 2.00e-01
29 9.6e-07 2.1e-10 1.8e-08 -8.53e+01 -8.54e+01 7.9e-01 6.1e-01 2.00e-01
30 4.9e-07 2.1e-10 6.8e-09 -8.53e+01 -8.54e+01 7.2e-01 4.9e-01 2.00e-01
31 2.9e-07 2.1e-10 3.5e-09 -8.53e+01 -8.53e+01 8.3e-01 5.3e-01 2.00e-01
32 1.7e-07 2.1e-10 1.6e-09 -8.53e+01 -8.53e+01 8.2e-01 5.8e-01 2.00e-01
33 9.0e-08 2.1e-10 7.0e-10 -8.53e+01 -8.53e+01 9.4e-01 7.3e-01 2.00e-01
34 3.7e-08 2.1e-10 1.9e-10 -8.53e+01 -8.53e+01 8.3e-01 7.3e-01 2.00e-01
35 1.5e-08 2.1e-10 5.2e-11 -8.53e+01 -8.53e+01 8.2e-01 7.4e-01 2.00e-01
36 6.1e-09 2.1e-10 1.3e-11 -8.53e+01 -8.53e+01 8.9e-01 8.0e-01 1.00e-01
37 1.7e-09 2.1e-10 2.5e-12 -8.53e+01 -8.53e+01 8.0e-01 7.7e-01 1.00e-01
38 5.2e-10 2.1e-10 7.7e-13 -8.53e+01 -8.53e+01 8.0e-01 7.7e-01 1.00e-01

phase.value = pdOPT
Iteration = 38
mu = +5.1893852558402975e-10
relative gap = +1.6651098299132361e-16
gap = +1.4210854715202004e-14
digits = +1.5778557115339556e+01
objValPrimal = -8.5344849089879474e+01
objValDual = -8.5344849089879489e+01
p.feas.error = +3.1172520315383907e-08
d.feas.error = +2.2496564611174108e-09
total time = 14055.847863
main loop time = 14048.877913
total time = 14055.847863
file check time = 0.000000
file change time = 0.004326
file read time = 6.965624
SDPA end at [Tue May 17 19:52:32 2016]
ALL TIME = 14304.279338
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新 GPU クラスタと SDPARA 納品

2016年05月17日 01時01分35秒 | Weblog
以下の追加分ですが、5月16日(月)に納品されました。

16GPU で 14.7TFlops といった性能値です。。。
[gpdpotrf] ### END n=249675, nb=1024, 4x4 procs, ver 50: 352.798sec --> 14705.437GFlops ###

◯追加分
ノード数4
各ノード
CPU : Intel(R) Xeon(R) CPU E5-2650 v3 @ 2.30GHz x 2 : 10cores / 1CPU
GPU : NVIDIA K40m x 2
メモリ:256GB
ネットワーク:GbE x 2 + Mellanox Infiniband FDR x 2
HDD : HP 1000GB 7.2krpm SC 2.5型 6G SATA ハードディスクドライブ
OS : CentOS 7.2


◯現在の GPU クラスタ
ノード数4
各ノード
CPU : Intel(R) Xeon(R) CPU E5-2640 v3 @ 2.60GHz x 2 : 8cores / 1CPU
GPU : NVIDIA K40m x 2
メモリ:256GB
ネットワーク:GbE x 2 + Mellanox Infiniband FDR x 2
HDD : HP 500GB 7.2krpm SC 2.5型 6G SATA ハードディスクドライブ
OS : CentOS 7.2









コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする