九大スパコン CX400 での SDPARA 7.6.0 の実行結果。384GPU で約 300TFlops, 128GPU で約 100TFlopsとなっている。
◯384GPU
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3756.253sec --> 296873.895GFlops ###
◯128GPU
[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6108.246sec --> 98703.346GFlops ###
高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)
◯384GPU
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3756.253sec --> 296873.895GFlops ###
◯128GPU
[gpdpotrf] ### END n=1218400, nb=1024, 8x16 procs, ver 50: 6108.246sec --> 98703.346GFlops ###
高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)