Cell (と言っても PS3 だが)の DMA 転送と SIMD 演算について、こちらでいろいろとデータを取ってもらっている。幸か不幸か使えるツール(関数)は限定されていてわかりやすいので、次にすべきことは見えてくるが、チューニングが大変面倒。他者のデータも重要だが、実機があるのでまずは自分でデータを取ってみるのが良い。Cell のように DMA 転送を行い、PPE と SPE では別の API を用いて、個別にプログラミングを行う方式は賛否両論あるが、少なくとも Intel はこの方式を次期チップでは採用しないようだ。
Cell では誰かがいろいろとライブラリを作成してくれれば良いと思っているが、それがあると今後はどれだけ最適化されているかが疑問になって、自分で作ったり変更したりしてみたくなる。
Cell では誰かがいろいろとライブラリを作成してくれれば良いと思っているが、それがあると今後はどれだけ最適化されているかが疑問になって、自分で作ったり変更したりしてみたくなる。