藤澤先生から
Westmere-EX 2.4GHz 20x2コアのマシンをアクセスさせてもらった。そこで、Rgemm gmp のベンチマークをとってみた。
* マシン:Westmere-EX 2.4GHz 20x2 cores
** ピークパフォーマンス(倍精度) TurboBoost offで: 2.4 * 40 * 4 = 384GFlops
* MPACK 0.7.0 (SVN)
* Intel Composer : 12.1.3
* reference implementation + openmp
* GMP : すべての演算を10進154桁で行った。
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた
結果は以下のようになった。
Westmere-EX 2.4GHz 20x2コアのマシンをアクセスさせてもらった。そこで、Rgemm gmp のベンチマークをとってみた。
* マシン:Westmere-EX 2.4GHz 20x2 cores
** ピークパフォーマンス(倍精度) TurboBoost offで: 2.4 * 40 * 4 = 384GFlops
* MPACK 0.7.0 (SVN)
* Intel Composer : 12.1.3
* reference implementation + openmp
* GMP : すべての演算を10進154桁で行った。
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた
結果は以下のようになった。
※コメント投稿者のブログIDはブログ作成者のみに通知されます