こちらのページあるいは SONY などが配布している開発者用のマニュアルでも良いと思うが、様々なドキュメントが用意されている。現在は動画処理や 3D 計算用などを主目的としているので倍精度はあまり重視していないかもしれないが、将来的には倍精度強化版が出てくるかもしれない。
SPE や SIMD 命令を用いて地道に並列化、高速化していく作業は大変だけれども楽しい作業だ。SDPA などはベクトルの内積計算が多いので、こういった高速化は効くと思うし、SDPA が高速化できれば SDPARA なども MPI と SPE & SIMD の二重並列化が効いてくると思う(DMA 転送の速度に依存するが)。その他の最適化手法(ダイクストラ法、
メタ解法)なども同じ発想で出来そうだ。
SPE や SIMD 命令を用いて地道に並列化、高速化していく作業は大変だけれども楽しい作業だ。SDPA などはベクトルの内積計算が多いので、こういった高速化は効くと思うし、SDPA が高速化できれば SDPARA なども MPI と SPE & SIMD の二重並列化が効いてくると思う(DMA 転送の速度に依存するが)。その他の最適化手法(ダイクストラ法、
メタ解法)なども同じ発想で出来そうだ。