最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

stream によるバンド幅測定 その2

2008年12月28日 03時30分54秒 | Weblog
CPU が Dual Core AMD Opteron(tm) Processor 270 のマシンがあって、2005 年製と今では古い型になっている。結果から言うと購入してもあまり役に立たなかった(計算速度が遅いので)。それでもメモリのバンド幅の値は Penryn 系の Xeon (X5460) よりも大きい。

1: Opteron : Dual Core AMD Opteron(tm) Processor 270 2.0GHz
Function Rate (MB/s) Avg time Min time Max time
Copy: 8726.2030 0.0037 0.0037 0.0037
Scale: 8724.5013 0.0037 0.0037 0.0037
Add: 8678.2444 0.0056 0.0055 0.0056
Triad: 8593.0510 0.0056 0.0056 0.0057

このマシン上で SDPA の性能はイマイチだったが、このメモリバンド幅の広さを活用したアプリケーションがあったのだろう。ちなみに Intel 初の 64bit Xeon (nocona コア)だと以下のようにバンド幅の値は低いが、SDPA の性能はこちらのマシン上での方が上である。

2: Xeon : nocona コア 2.8GHz
Function Rate (MB/s) Avg time Min time Max time
Copy: 2870.7832 0.0112 0.0111 0.0113
Scale: 2902.7581 0.0111 0.0110 0.0113
Add: 3234.0582 0.0149 0.0148 0.0149
Triad: 3098.3332 0.0155 0.0155 0.0156

最後は Cell (PS3) マシンを用いる。メモリバンド幅のカタログスペックは 25.6GB/s だが、PPE だけだとメモリバンド幅が使い切れないのだろうか。

3: Cell : Cell BE 3.2GHz
Function Rate (MB/s) Avg time Min time Max time
Copy: 2763.3305 0.0118 0.0116 0.0121
Scale: 2453.0335 0.0131 0.0130 0.0132
Add: 3289.9190 0.0147 0.0146 0.0149
Triad: 3249.1945 0.0152 0.0148 0.0180
コメント (2)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« stream によるバンド幅測定 | トップ | SDPA Online Solver とクラウ... »
最新の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
Unknown (後藤)
2008-12-23 14:49:44
このベンチマークのように、実際のアプリケーションとStream ベンチマークの結果との対応が取れない場合が多いです。私はこのベンチマークが嫌いなので自分で作ってみようと思っています。
返信する
Unknown (藤澤)
2008-12-24 01:58:10
Stream も結果を見ていると面白いですが(値が正しければですが)、確かに SDPA などの結果とは異なる場合が多いです。SDPA も解く問題やパラメータによっては、キャッシュやメモリバンド幅に依存したりと変化しますので、ベンチマークみたいにして使ってます。Nehalem と Shanghai になって、疎な問題に対するマルチスレッドの効果が上がってきました。
返信する

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事