研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

cudaMemcpy の実装。

2009-07-17 10:25:02 | Weblog
cudaMemcpy は非同期で転送しているので、mmap を中で呼んでいるのかと思い、strace で呼び出された system call を調べてみるもない。(cudaMemcpy の前と後でそれぞれ strace して diff で確認。)

もし mmap なら PageSize 毎にアクセスするなどをしてで、転送確認をすることができそうだが、違うようだ。なんというか掴めないような仕様がいくつかあるため、個人的には扱いにくい。