スパコンでの一連の実験に関して、メーカーに報告書を提出した。まだ一般に公開出来ない内容も多いので、こちらから公開することは現時点では行わない。今回は試用期間が短かったので、台数効果やコンパイラ等による性能差などを測定することは行わないでひたすら大きな問題を解くことに集中した。
コンパイラについては、メーカー製、Intel, PGI, GNU gcc が使用できたが、OpenMP 等の性能も考えて結局 Intel コンパイラに統一した。MPI もメーカー製、OpenMPI, MVAPICH2 が使用できたが、こちらは OpenMPI に統一した。他の組合せを調べている時間が無かったので、この組合せ(Intel コンパイラ + OpenMPI) がベストかについては何とも言えない。
○ 某スパコン
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64
コンパイラについては、メーカー製、Intel, PGI, GNU gcc が使用できたが、OpenMP 等の性能も考えて結局 Intel コンパイラに統一した。MPI もメーカー製、OpenMPI, MVAPICH2 が使用できたが、こちらは OpenMPI に統一した。他の組合せを調べている時間が無かったので、この組合せ(Intel コンパイラ + OpenMPI) がベストかについては何とも言えない。
○ 某スパコン
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64