理由はわかりませんが、1回目よりも2回目の実行の方が少しだけ性能が落ちてます。。。
◯384GPU
1回目:11月27日
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3756.253sec --> 296873.895GFlops ###
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3733.636sec --> 298672.240GFlops ###
2回目:12月26日
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3796.980sec --> 293689.593GFlops ###
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3790.625sec --> 294181.923GFlops ###
問題のサイズ
1495602 = mDIM
1 = nBLOCK
3069 = bLOCKsTRUCT
高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)
◯384GPU
1回目:11月27日
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3756.253sec --> 296873.895GFlops ###
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3733.636sec --> 298672.240GFlops ###
2回目:12月26日
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3796.980sec --> 293689.593GFlops ###
[gpdpotrf] ### END n=1495602, nb=1024, 16x24 procs, ver 50: 3790.625sec --> 294181.923GFlops ###
問題のサイズ
1495602 = mDIM
1 = nBLOCK
3069 = bLOCKsTRUCT
高性能演算サーバシステム (Fujitsu PRIMERGY CX400)
演算ノード 理論演算性能 345.6GFLOPS
主記憶容量 128GB
メモリバンド幅 102.4GB/s
総ノード数 1476ノード
総プロセッサ (コア) 数 2952プロセッサ (23616コア)
理論演算性能(倍精度実数)の総和 966.2TFLOPS
(CPU: 510.1TF, GPGPU[K20m&K20Xm]: 456.1TF)