中田真秀(なかたまほ)のブログ

研究について、日常について、その他。

Rgemm __float128 on AMD Opteron Magny-Cours 2.4GHz 48 cores

2012-05-08 13:41:09 | 日記
藤澤先生から
Opteron Magny-Cours 2.4GHz 12x4コアのマシンをアクセスさせてもらった。そこで、Rgemm __float128 のベンチマークをとってみた。
これはIEEE 754 2008で定義されているbinary128のgccでの実装である。

* マシン:AMD Opteron Magny-Cours 2.4GHz 12x4 = 48 cores
* MPACK 0.7.0 (SVN)
* gcc 4.6.3
* reference implementation + openmp
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた



300MFlopsとddと比較するとほぼ同じ精度なのに10倍も遅い!!
行列のサイズが大きくなると、おそくなるというのは今回は見られなかった。
きっとメモリアクセスはボトルネックにならない程度に演算が遅いのであろうと思われる。


最新の画像もっと見る

コメントを投稿