2012年2月28日のブログ記事一覧-最適化問題に対する超高速＆安定計算

TSUBAME 2.0 と SDPA, SDPARA　その１１

2012年02月28日 02時55分40秒 | Weblog

昨日続きで性能効率 14.6 % ということは 6.2730e+13 FLOPS * (290.08 / 1975.6) = 9.2107e+12 FLOPS なので、要するに 410 ノード(2CPU)で約 9.2 TFLOPS しか出ていないことになる。
原因としては
１：各ノードでの行列サイズが小さい
２：ネットワーク性能の低下
が考えられる。
ちなみに 2CPU + 3GPU 構成では行列の大きさは異なるが、16 ノードで 10TFlops を越える性能になっている。

◯東工大 TSUBAME 2.0
HP Proliant SL390s G7 1408台
HP Proliant SL390s G7
CPU: Intel Xeon 2.93GHz 6コア×2ソケット = 12コア(Hyperthreading時 = 24コア)
GPU: NVIDIA Tesla M2050 3GPU
Memory: 54GB (一部は96GB)
SSD: 120GB (一部は240GB)
ネットワーク: QDR InfiniBand x 2 = 80Gbps

◯１ノードあたりの性能（倍精度)
CPU 140GF(2.93GHz) + GPU 1545GF = 1685GF
CPU 153GF(3.2GHz : TB) + GPU 1545GF = 1698GF

2012年2月
日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

アクセス
閲覧	801	PV
訪問者	503	IP
トータル
閲覧	5,058,650	PV
訪問者	1,295,117	IP

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

TSUBAME 2.0 と SDPA, SDPARA その１１

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ

TSUBAME 2.0 と SDPA, SDPARA　その１１