藤澤先生から
Opteron Magny-Cours 2.4GHz 12x4コアのマシンをアクセスさせてもらった。そこで、Rgemm gmp のベンチマークをとってみた。
IntelのコンパイラでのバイナリはAMDの石では遅くなる可能性があるからだ。
* マシン:AMD Opteron Magny-Cours 2.4GHz 12x4 = 48 cores
* MPACK 0.7.0 (SVN)
* gcc 4.6.3
* reference implementation + openmp
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた
結果はIntel composerの勝利で、gccではかなり性能も不安定に見える。
Opteron Magny-Cours 2.4GHz 12x4コアのマシンをアクセスさせてもらった。そこで、Rgemm gmp のベンチマークをとってみた。
IntelのコンパイラでのバイナリはAMDの石では遅くなる可能性があるからだ。
* マシン:AMD Opteron Magny-Cours 2.4GHz 12x4 = 48 cores
* MPACK 0.7.0 (SVN)
* gcc 4.6.3
* reference implementation + openmp
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた
結果はIntel composerの勝利で、gccではかなり性能も不安定に見える。