理研計算科学研究機構の今村先生からInterlagos64コアマシンに
アクセスさせていただいたので、MPACK Rgemm DDのベンチを行ってみた。
* CPU: AMD Interlagos64 cores, 64 cores.
* Software: MPACK 0.7.0 (svn)
* Compiler: Intel Composer 12.1.2 20111128
* FMAは使ってない。
前のMagny-Coursと同じように行列のサイズが
700-800位にパフォーマンスが落ちた。ここはAMDのチップに特有のパフォーマンス劣化のようである。
ただ、ピークは6GFlopsまで上がっている。FMAは使っていない。FMAを使ってもサイズが大きくなったときのパフォーマンスロスは解決しないと思われる。
アクセスさせていただいたので、MPACK Rgemm DDのベンチを行ってみた。
* CPU: AMD Interlagos64 cores, 64 cores.
* Software: MPACK 0.7.0 (svn)
* Compiler: Intel Composer 12.1.2 20111128
* FMAは使ってない。
前のMagny-Coursと同じように行列のサイズが
700-800位にパフォーマンスが落ちた。ここはAMDのチップに特有のパフォーマンス劣化のようである。
ただ、ピークは6GFlopsまで上がっている。FMAは使っていない。FMAを使ってもサイズが大きくなったときのパフォーマンスロスは解決しないと思われる。
※コメント投稿者のブログIDはブログ作成者のみに通知されます