最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

HP Moonshot 上での Linpack

2015年04月25日 03時39分28秒 | Weblog
以下の HP Moonshot において Linpack 測定を開始しました。

CPU Intel(R) Xeon(R) CPU E3-1284L v3 @ 1.80GHzは 16FLOPS/clock/core ですので、全体では 45カートリッジ x 4 コア x 2.6GHz(TurboBoost時) x 16FLOPS = 7488GFlops のピーク性能になります。
以下の場合では性能効率は 5251 / 7488 = 70.12%なので、まだまだ低い性能です。

================================================================================
HPLinpack 2.1 -- High-Performance Linpack benchmark -- October 26, 2012
Written by A. Petitet and R. Clint Whaley, Innovative Computing Laboratory, UTK
Modified by Piotr Luszczek, Innovative Computing Laboratory, UTK
Modified by Julien Langou, University of Colorado Denver
================================================================================

An explanation of the input/output parameters follows:
T/V : Wall time / encoded variant.
N : The order of the coefficient matrix A.
NB : The partitioning blocking factor.
P : The number of process rows.
Q : The number of process columns.
Time : Time in seconds to solve the linear system.
Gflops : Rate of execution for solving the linear system.

The following parameter values will be used:

N : 400000
NB : 128 256
PMAP : Row-major process mapping
P : 5 9
Q : 9 5
PFACT : Left Crout Right
NBMIN : 2 4
NDIV : 2
RFACT : Left Crout Right
BCAST : 1ring
DEPTH : 0
SWAP : Mix (threshold = 64)
L1 : transposed form
U : transposed form
EQUIL : yes
ALIGN : 8 double precision words

--------------------------------------------------------------------------------

- The matrix A is randomly generated for each test.
- The following scaled residual check will be computed:
||Ax-b||_oo / ( eps * ( || x ||_oo * || A ||_oo + || b ||_oo ) * N )
- The relative machine precision (eps) is taken to be 2.220446e-16
- Computational tests pass if scaled residuals are less than 16.0

================================================================================
T/V N NB P Q Time Gflops
--------------------------------------------------------------------------------
WR00L2L2 400000 128 5 9 8125.38 5.251e+03
HPL_pdgesv() start time Thu Apr 23 16:40:35 2015

HPL_pdgesv() end time Thu Apr 23 18:56:00 2015

--------------------------------------------------------------------------------
||Ax-b||_oo/(eps*(||A||_oo*||x||_oo+||b||_oo)*N)= 0.0006944 ...... PASSED


HP ProLiant m710 サーバーカートリッジ

プロセッサー Intel® Xeon® E3-1284L v3(1.8-3.2GHz/8コア/6MB/47W)
キャッシュメモリ 6MB共有Level 3
メモリ タイプ HP 8GB(1x8GB)PC3L-12800(DDR3-1600)SODIMM低電圧メモリ 使用可能DIMMスロット数 SODIMMスロット x 4 最大構成 32GB(4 x 8GB)
ネットワークコントローラー Mellanox Connect-X3 Pro デュアル10GbE NIC。RDMA over Converged Ethernet(RoCE)をサポート
最大内蔵ストレージ (Moonshotサーバーあたり) M.2 2280ソリッドステートデバイス 120GB & 480GB





コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 共進化社会システムイノベー... | トップ | cuSolverSP: sparse LAPACK F... »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事