普段はサーバ上で実験を行っているが、
性能が異なると指摘を受けた SDPA クラスタ(16 nodes で 1.399 TFLOPS)のノードで実験も行った。
2つの構成はほぼ一緒であるが、Xeon クラスタの方が後に購入した。
実験をすることで、特性が異なることが分かったので、紹介する。
画像は、1コアでの実行時間に比べ、どれだけ各コアの性能が出ているかというもので、
4並列であれば、実行時間が 1/4 になっていれば、100 % となる。
画像によると後から買った方のクラスタの方が、
全体的に実行時間が短く、2コアにした時の性能低下がない。
その分、4, 8 となった時に落ちてしまっているが、
クラスタの方がもともとの実行時間が短いため、こちらの方が性能が良いといえる。
性能が異なると指摘を受けた SDPA クラスタ(16 nodes で 1.399 TFLOPS)のノードで実験も行った。
2つの構成はほぼ一緒であるが、Xeon クラスタの方が後に購入した。
実験をすることで、特性が異なることが分かったので、紹介する。
CPU : Xeon X5460 3.16 GHz Memory : 48 GB OS : CentOS 5.2 x86_64 GCC : gcc 4.1.2
画像は、1コアでの実行時間に比べ、どれだけ各コアの性能が出ているかというもので、
4並列であれば、実行時間が 1/4 になっていれば、100 % となる。
画像によると後から買った方のクラスタの方が、
全体的に実行時間が短く、2コアにした時の性能低下がない。
その分、4, 8 となった時に落ちてしまっているが、
クラスタの方がもともとの実行時間が短いため、こちらの方が性能が良いといえる。
※コメント投稿者のブログIDはブログ作成者のみに通知されます