CSX600をこの前おすすめに来ました。
![](http://www.nissho-ele.co.jp/product/clearspeed/images/img02.jpg)
http://www.nissho-ele.co.jp/product/clearspeed/
メリットは 33Wで50GFlopsくらい出るとのこと。
東工大のTSUBAMEにも刺さりまくってます。
リンパック計算できます。
さて、
もちろん私は興味ないです。
GPU使ってるし、MATLABとか使いません。
日商さんは省電力をものすごい売りにしていて、
GPUの電力消費を問題だといっていたけど、
「flops/W」を計算したらGPUの3倍は電気食ってるよ、、、CSX、、、
なんか売り文句に
「# ライブラリによる自動並列処理により、複数CPUと複数枚のボードに対して命令を分散させ、最大76GFLOPSを記録。」
と書いてありますが、
8core + 2boards で76Gflops
さて、
1core + 2boards= 66Gflops
8core + 1board = 56Gflops
1core + 1board = 44Gflops
1core = 4Gflops
ということなんですが、
+1bord あたり、
1coreだと+12Gflops
2coreだと+20Gflops
なんか説明受けても結局ボードが偉いんじゃなくて、
このcsxライブラリが偉いんだと思うんですよ。。。
csxライブラリ使って8coreのみの計算でかなり速くなるらしい、、、
つまり、、
Dual core なマシンなら100万くらいでボード買うより、
ライブラリだけ買って、Quad core にした方が速い気がする。
そもそも
「MATLAB上でLevel3 BLASのDGEMM演算を計算させ、」
というのが、
そもそもMATLABが遅すぎるんじゃないの?
という気がしてならない。
んで、
私は要らなくてもMATLABユーザは使いこなせるようなので、ちょっとお試しさせてもらうことになりました。オンボードメモリが1GBだけど、大規模な行列演算とか可能なんだろうか? 色々心配事はあるんだけど、まぁ俺は検証できないしね。。。
ちなみになんで東工大が欲しがったかというと、AMBERユーザが多いとのこと。。。まぁAMBERは理研に居たときから良く聞きました。MDGRAPEより桁違いに遅く、けどみんな使ってるからみんな使うんだと。まぁ色々黒い話もあるんだろうけどさ。実際CSXを使っている間はCPUを占拠しないので、TSUBAMEユーザはCSXとCPUに分かれて仲良く研究をしているらしい。。。
#こういう需要があるなら、GRAPE-DRが出たらお勧めしてみるかな。。。
![](http://www.nissho-ele.co.jp/product/clearspeed/images/img02.jpg)
http://www.nissho-ele.co.jp/product/clearspeed/
メリットは 33Wで50GFlopsくらい出るとのこと。
東工大のTSUBAMEにも刺さりまくってます。
リンパック計算できます。
さて、
もちろん私は興味ないです。
GPU使ってるし、MATLABとか使いません。
日商さんは省電力をものすごい売りにしていて、
GPUの電力消費を問題だといっていたけど、
「flops/W」を計算したらGPUの3倍は電気食ってるよ、、、CSX、、、
なんか売り文句に
「# ライブラリによる自動並列処理により、複数CPUと複数枚のボードに対して命令を分散させ、最大76GFLOPSを記録。」
と書いてありますが、
8core + 2boards で76Gflops
さて、
1core + 2boards= 66Gflops
8core + 1board = 56Gflops
1core + 1board = 44Gflops
1core = 4Gflops
ということなんですが、
+1bord あたり、
1coreだと+12Gflops
2coreだと+20Gflops
なんか説明受けても結局ボードが偉いんじゃなくて、
このcsxライブラリが偉いんだと思うんですよ。。。
csxライブラリ使って8coreのみの計算でかなり速くなるらしい、、、
つまり、、
Dual core なマシンなら100万くらいでボード買うより、
ライブラリだけ買って、Quad core にした方が速い気がする。
そもそも
「MATLAB上でLevel3 BLASのDGEMM演算を計算させ、」
というのが、
そもそもMATLABが遅すぎるんじゃないの?
という気がしてならない。
んで、
私は要らなくてもMATLABユーザは使いこなせるようなので、ちょっとお試しさせてもらうことになりました。オンボードメモリが1GBだけど、大規模な行列演算とか可能なんだろうか? 色々心配事はあるんだけど、まぁ俺は検証できないしね。。。
ちなみになんで東工大が欲しがったかというと、AMBERユーザが多いとのこと。。。まぁAMBERは理研に居たときから良く聞きました。MDGRAPEより桁違いに遅く、けどみんな使ってるからみんな使うんだと。まぁ色々黒い話もあるんだろうけどさ。実際CSXを使っている間はCPUを占拠しないので、TSUBAMEユーザはCSXとCPUに分かれて仲良く研究をしているらしい。。。
#こういう需要があるなら、GRAPE-DRが出たらお勧めしてみるかな。。。
で、DGEMMのサイズとか、8coreのみでの速度とかが書いてないのがいい感じですね。
> TSUBAMEユーザはCSXとCPUに分かれて
GPUでもそうですが問題を選ばないとI/Oネックになるので、みんながCSXを使いたがることはないのでしょうね。