最終チェック中だが、Rgemm DD がCUDA4.2でも動くようになった。
久しぶりにC2050のマシンにログインすると、CUDAが4.2になってた。このマシンはCUDA3のはずだろ!!
ダウングレードしてよ!とか思ったが、そうもいってられないので、(藤澤さんになぜ
SDPA-DDを配布しないのだと聞いたら、CUDA4に対応してないからだ、様々なプラットフォームを
サポートすべし、とのことであった)、ちょっと頑張ってみた。
今までやる気をだしてなかったが、半日でダメだったらまたあきらめるという
ことを思いつつ、あるアイディアをつかってみたらさくっとポートできた。
チェック。とりあえずは動いているが、0.2-0.3%ほど遅くなった。
ま~しかたないかな。
おつかれさま。
久しぶりにC2050のマシンにログインすると、CUDAが4.2になってた。このマシンはCUDA3のはずだろ!!
ダウングレードしてよ!とか思ったが、そうもいってられないので、(藤澤さんになぜ
SDPA-DDを配布しないのだと聞いたら、CUDA4に対応してないからだ、様々なプラットフォームを
サポートすべし、とのことであった)、ちょっと頑張ってみた。
今までやる気をだしてなかったが、半日でダメだったらまたあきらめるという
ことを思いつつ、あるアイディアをつかってみたらさくっとポートできた。
チェック。とりあえずは動いているが、0.2-0.3%ほど遅くなった。
ま~しかたないかな。
おつかれさま。