中田真秀(なかたまほ)のブログ

研究について、日常について、その他。

Rgemm gmp (gcc 4.6.3 compiled) on AMD Opteron Magny-Cours 2.4GHz 48 cores

2012-05-08 14:01:38 | 日記
藤澤先生から
Opteron Magny-Cours 2.4GHz 12x4コアのマシンをアクセスさせてもらった。そこで、Rgemm gmp のベンチマークをとってみた。
IntelのコンパイラでのバイナリはAMDの石では遅くなる可能性があるからだ。

* マシン:AMD Opteron Magny-Cours 2.4GHz 12x4 = 48 cores
* MPACK 0.7.0 (SVN)
* gcc 4.6.3
* reference implementation + openmp
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた



結果はIntel composerの勝利で、gccではかなり性能も不安定に見える。

Rgemm __float128 on AMD Opteron Magny-Cours 2.4GHz 48 cores

2012-05-08 13:41:09 | 日記
藤澤先生から
Opteron Magny-Cours 2.4GHz 12x4コアのマシンをアクセスさせてもらった。そこで、Rgemm __float128 のベンチマークをとってみた。
これはIEEE 754 2008で定義されているbinary128のgccでの実装である。

* マシン:AMD Opteron Magny-Cours 2.4GHz 12x4 = 48 cores
* MPACK 0.7.0 (SVN)
* gcc 4.6.3
* reference implementation + openmp
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた



300MFlopsとddと比較するとほぼ同じ精度なのに10倍も遅い!!
行列のサイズが大きくなると、おそくなるというのは今回は見られなかった。
きっとメモリアクセスはボトルネックにならない程度に演算が遅いのであろうと思われる。


gcc compiled Rgemm DD on AMD Opteron Magny-Cours 2.4GHz 48 cores

2012-05-08 13:26:47 | 日記
藤澤先生から
Opteron Magny-Cours 2.4GHz 12x4コアのマシンをアクセスさせてもらった。そこで、Rgemm dd のベンチマークをとってみた。
今回は、gccを用いた。Intel ComposerはAMDの石ではパフォーマンスが出ない可能性があるため、それを比較するためである。

* マシン:AMD Opteron Magny-Cours 2.4GHz 12x4 = 48 cores
* MPACK 0.7.0 (SVN)
* gcc 4.6.3
* reference implementation + openmp
* Rgemm (dgemm like routine), すべて正方行列、初期値はランダムな行列。
* スレッド数は1,2,4,8,16,...など変えた

ピークパフォーマンスが、3.5GFlopsから3GFlopsまで落ちている。行列のサイズが大きくなるとほぼ同様のパフォーマンス下落がみられた。

首都大講義分析化学II四回目

2012-05-08 12:44:23 | 日記
四回め。

さて、教科書が不具合散見されるので、どうしたらいいのか思いあぐねる。つまり、
定義をせずになんとなく文脈から言葉を定義するような書き方をしているところがあるのだ。
具体的には、酸化還元滴定の章には、酸化還元滴定の定義が書いてなかった。文脈からは、還元剤か酸化剤を
用いて滴定するということがなんとかわかるが、さすがに不親切であろう。著者に連絡を取って議論したい気にも一瞬なるが...

で、やっぱり学部生相手の授業というのはどうしても研究の話ができず、単調になってしまった。
教科書の書き方は高校生レベルであった。ロジカルには全く問題がないが、大学で習う微積で
エレガントに処理したいものである。高校までの数学、物理だとどうしても微分積分がいい加減なので
不満もたまるが、ちゃんと実数から始まる微積をやると、いろんなものがキッチリ処理できてすっきり
する。微積はそもそも物理(ニュートンやライプニッツ)からきているものなので相性は抜群である。

前回は比較的優秀だったので今回は、センスを問う問題を出してみた。今回のセンスとは、物理的、化学的な
近似とは何かということである。どの物理量がどの物理量より小さく無視できる、ということである。
授業中連呼してみた。数名、ちゃんとわかってくれている人がいた。

今回も午後二時半くらいからの、眠い時間まじめに皆さん聞いてくれてうれしかった。
ありがたいです。

Rgemm GMP on AMD Opteron Interlagos 2.1GHz 64 cores

2012-05-01 13:24:35 | 日記
理研計算科学研究機構の今村先生からInterlagos64コアマシンに
アクセスさせていただいたので、MPACK Rgemm GMPのベンチを行ってみた。

* CPU: AMD Interlagos64 cores, 64 cores.
* Software: MPACK 0.7.0 (svn)
* Compiler: Intel Composer 12.1.2 20111128



前のMagny-Coursとは少々挙動が異なる。まず、
パフォーマンスが大きく落ちた。そして、行列のサイズが200-300程度でのピークは消失、サイズが大きくなってもパフォーマンスが極端に落ちるという現象もなくなり、素直なパフォーマンス曲線になっているが、今回はコアでのスケールが非常にわるい。