最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

IBM Cell SDK 3.0

2007年12月13日 22時52分31秒 | Weblog
PS3 の Linux を Fedora Core 5 から Fedore 7 に変更して、IBM の Cell SDK 3.0 を導入してみた。目標は Cell BE 用に開発された BLAS である。DGEMM を使おうと思ってみたが、とにかく制限がきつい。
C ← A * B + C
1: A, B, C は 16byte 境界のアラインメントにする。
double A [M * K] __attribute__( (aligned (16)));
とすれば良い。
2: A と C の行数は DGEMM では 2の倍数に限定
3: B と C の列数は DGEMM では 4の倍数に限定
4: A の列数と B の行数は DGEMM では 2の倍数に限定

というわけで、インプリメントが面倒なのでしばらく採用を見送りにする。
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« キツツキ戦法 | トップ | gcc 4.2.2 »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事