2016年6月8日のブログ記事一覧-最適化問題に対する超高速＆安定計算

九大スパコンでの Graph500

2016年06月08日 00時48分42秒 | Weblog

HA8000 では 1プロセスから 2プロセスのときの性能差が異様に大きくなっておりますが、これであっているのでしょうか？

()の中は１ノード内での MPI プロセス数。
SCALE=28
CX400
4nodes 5.9GTEPS (1), 12.4GTEPS (2)
8nodes 11.7GTEPS (1), 24.7GTEPS (2)
16nodes 22.5GTEPS (1), 46.3GTEPS (2)
32nodes 41.3GTEPS (1), 87.7GTEPS (2)
HA8000
4nodes 6.9GTEPS (1), 13.7GTEPS (2), 21.8GTEPS (4)
8nodes 12.3GTEPS (1), 38.6GTEPS (2), 40.5GTEPS (4)
16nodes 24.6GTEPS (1), 67.9GTEPS (2), 74.0GTEPS (4)
32nodes 26.3GTEPS (1), 114.2GTEPS (2), 127.9GTEPS (4)

SCALE=34　
HA8000
32nodes 58.9GTEPS (1), 131.8GTEPS(2), 130.8GTEPS(4)

高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能（倍精度実数）の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)

高性能アプリケーションサーバ HA8000-tc/HT210
◯CPUノード
Intel Xeon E5-2697 v2 (2.7 GHz, 12core)×2
主記憶容量 256GB
◯Xeon Phiノード
Intel Xeon E5-2697 v2 (2.7 GHz, 12core)×2 Intel Xeon Phi 5100P (1,010.88 GFLOPS)×2
主記憶容量 256GB
総ノード数 965ノード
(CPU : 860ノード, Xeon Phi : 105ノード)
総CPUコア数 23,160コア
理論演算性能（倍精度実数）の総和 712.46TFLOPS
(CPU : 500.26TFLOPS, Xeon Phi : 212.2TFLOPS)
主記憶容量の総和約241.25TB
ディスクアレイ装置実効容量 3.57PB

記事一覧 | 画像一覧 | フォロワー一覧 | フォトチャンネル一覧

アクセス
閲覧	584	PV
訪問者	352	IP
トータル
閲覧	5,060,530	PV
訪問者	1,296,277	IP

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	【コメント募集中】goo blogスタッフの気になったニュース
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

九大スパコンでの Graph500

カレンダー

Twitter

最新記事

検索

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ

2016年6月
日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

九大スパコンでの Graph500

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ