某スパコンと言っても下記の仕様を見れば、わかる人にはどこのスパコンなのかわかるだろうが、一つだけ実験結果を載せておく。CPU のクロック周波数等が異なるが、使用しているコア数が 2048/128 = 16倍になって、実行時間がたかだか2倍程度にしか速くならないのはやはり意外である。本当はプロセス数やコア数を同じにしたり適宜変更して実行してみれば、いろいろとわかるのだろうが、スパコンを借りられる期間が短いのと他にも解きたい問題があるので、その辺の実験は省略する。
○問題名 : H2O.1A1.DZ.pqgt1t2p.dat-s
○ソフトウェア : SDPARA 7.3.2
○実験結果
SDPA クラスタ
16プロセス x 8スレッド : 49037.9s(37反復 : pdOPT) : 約13時間37分
某スパコン
128プロセス x 16スレッド : 24850.4s(38反復 : pdOPT) : 約6時間54分
○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.4 for x86_64
○ 某スパコン
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64
○問題名 : H2O.1A1.DZ.pqgt1t2p.dat-s
○ソフトウェア : SDPARA 7.3.2
○実験結果
SDPA クラスタ
16プロセス x 8スレッド : 49037.9s(37反復 : pdOPT) : 約13時間37分
某スパコン
128プロセス x 16スレッド : 24850.4s(38反復 : pdOPT) : 約6時間54分
○ SDPA クラスタ
16 Nodes, 32 CPUs, 128 CPU cores;
CPU : Intel Xeon 5460 3.16GHz (quad cores) x 2 / node
Memory : 48GB / node
NIC : GbE x 2 and Myrinet-10G x 1 / node
OS : CentOS 5.4 for x86_64
○ 某スパコン
128 Nodes, 512 CPUs, 2048 CPU cores; (今回使用した分のみ)
CPU : AMD Opteron 8356 2.3GHz (quad cores) x 4 / node
Memory 32GB / node
NIC : GbE x 2 and Infiniband x 4 / node
OS : RHEL 4.x for x86_64