以下の二つの計算サーバを用いて、1 ノード上での SDPA と SDPARA の性能を比較した。SDPARA の方は MPI と Pthread による二段階並列になっているので、これも様々な組合せを調べてみた。やはり1ノードであれば余計なオーバーヘッドが無い分だけ SDPA の方が速い。また、SDPARA では CPU数 = MPI, 1CPU あたりのコア数 = Pthread とするのが、一番性能が良さそうだが以下の結果を見るとそれほど単純では無さそうだ。
○ 計算サーバ1 (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4 (24コア)
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○ 計算サーバ2 (2 CPU x 4 コア = 8 コア)
CPU : Intel Xeon 5550 (2.66GHz / 8MB L3) x 2 (8コア)
Memory : 72GB (18 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○ 問題 : NH3+.2A2\".STO6G.pqgt1t2p.dat-s
○ 計算サーバ1:
■ SDPA 7.3.2 (24コア) : 4m15s
■ SDPARA 7.3.2 (1 MPI x 24 Pthread) : 4m58s
■ SDPARA 7.3.2 (2 MPI x 12 Pthread) : 4m19s
■ SDPARA 7.3.2 (4 MPI x 6 Pthread) : 4m31s
■ SDPARA 7.3.2 (6 MPI x 4 Pthread) : 4m35s
■ SDPARA 7.3.2 (12 MPI x 2 Pthread) : 4m59s
■ SDPARA 7.3.2 (24 MPI x 1 Pthread) : 5m52s
○ 計算サーバ2:
■ SDPA 7.3.2 (8コア) : 8m4s
■ SDPARA 7.3.2 (1 MPI x 8 Pthread) : 8m17s
■ SDPARA 7.3.2 (2 MPI x 4 Pthread) : 8m20s
■ SDPARA 7.3.2 (4 MPI x 2 Pthread) : 8m43s
■ SDPARA 7.3.2 (8 MPI x 1 Pthread) : 9m18s
○ 計算サーバ1 (4 CPU x 6 コア = 24 コア)
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4 (24コア)
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○ 計算サーバ2 (2 CPU x 4 コア = 8 コア)
CPU : Intel Xeon 5550 (2.66GHz / 8MB L3) x 2 (8コア)
Memory : 72GB (18 x 4GB / 800MHz)
OS : Fedora 13 for x86_64
○ 問題 : NH3+.2A2\".STO6G.pqgt1t2p.dat-s
○ 計算サーバ1:
■ SDPA 7.3.2 (24コア) : 4m15s
■ SDPARA 7.3.2 (1 MPI x 24 Pthread) : 4m58s
■ SDPARA 7.3.2 (2 MPI x 12 Pthread) : 4m19s
■ SDPARA 7.3.2 (4 MPI x 6 Pthread) : 4m31s
■ SDPARA 7.3.2 (6 MPI x 4 Pthread) : 4m35s
■ SDPARA 7.3.2 (12 MPI x 2 Pthread) : 4m59s
■ SDPARA 7.3.2 (24 MPI x 1 Pthread) : 5m52s
○ 計算サーバ2:
■ SDPA 7.3.2 (8コア) : 8m4s
■ SDPARA 7.3.2 (1 MPI x 8 Pthread) : 8m17s
■ SDPARA 7.3.2 (2 MPI x 4 Pthread) : 8m20s
■ SDPARA 7.3.2 (4 MPI x 2 Pthread) : 8m43s
■ SDPARA 7.3.2 (8 MPI x 1 Pthread) : 9m18s