前回の続きで SDPA 7.4.0 と CSDP 6.1.1 のマルチスレッド計算時の実行時間をさらに詳細に比較する。全体の実行時間(Total)と ELEMENTS (SCM の計算) 及び CHOLESKY(SCM の Cholesky 分解) の計算時間で比較を行う。スレッド数は 1 から 48 まで変化させていく。
◯問題 : Be.1S.SV.pqgt1t2p.dat-s
まずは全体の実行時間(Total)の比較。16 スレッドまではあまり大きな差は無いが、24 スレッド以降は両者の差が大きくなる。CSDP は性能が上がらない、あるいは悪化していくが、SDPA の方は順調に計算時間が減少していく。
ELEMENTS 部分の実行時間の比較。全体の実行時間の中で ELEMENTS が大きな割合を占めるので、ELEMENTS と Total の傾向はほとんど同じ。
CHOLESKY 部分の実行時間の比較。両者ともこの部分はほぼ BLAS (LAPACK) ライブラリに委託なので、ほとんど差は見られない。
○計算サーバ (4 CPU x 12 コア = 48 コア)
CPU : AMD Opteron 6174 (2.20GHz / 12MB L3) x 4個
メモリ : 256GB (16 x 16GB / 1066MHz)
OS : Fedora 15 for x86_64
◯問題 : Be.1S.SV.pqgt1t2p.dat-s
まずは全体の実行時間(Total)の比較。16 スレッドまではあまり大きな差は無いが、24 スレッド以降は両者の差が大きくなる。CSDP は性能が上がらない、あるいは悪化していくが、SDPA の方は順調に計算時間が減少していく。
ELEMENTS 部分の実行時間の比較。全体の実行時間の中で ELEMENTS が大きな割合を占めるので、ELEMENTS と Total の傾向はほとんど同じ。
CHOLESKY 部分の実行時間の比較。両者ともこの部分はほぼ BLAS (LAPACK) ライブラリに委託なので、ほとんど差は見られない。
○計算サーバ (4 CPU x 12 コア = 48 コア)
CPU : AMD Opteron 6174 (2.20GHz / 12MB L3) x 4個
メモリ : 256GB (16 x 16GB / 1066MHz)
OS : Fedora 15 for x86_64