MAGMAのコード見た。まぁこんな感じか。実装重要だな。
コレスキー分解見たが、dpotrf.fほぼそのまま。どうFermi/Teslaに投げるかが問題になってる。また時々CPUのLAPACKを
呼んでる。なるほど。コードとしては、GPU/CPU両方混ぜるのが正しそう(あたりまえか)。MPACKも
CPU最適化が必要だが...
どうやってコード書くべきかというのもホント重要なんだよな。
将来的にはライブラリにつなげるということをしないと、論文だけでは消えてしまう。思いを新たにした。
コレスキー分解見たが、dpotrf.fほぼそのまま。どうFermi/Teslaに投げるかが問題になってる。また時々CPUのLAPACKを
呼んでる。なるほど。コードとしては、GPU/CPU両方混ぜるのが正しそう(あたりまえか)。MPACKも
CPU最適化が必要だが...
どうやってコード書くべきかというのもホント重要なんだよな。
将来的にはライブラリにつなげるということをしないと、論文だけでは消えてしまう。思いを新たにした。