CUDA では Grid, Block, Thread の階層が用意されており、それぞれに対応したメモリが配置されている。
Gloval Memory : すべてのスレッド&ホストからアクセス可。キャッシュされない。
Shared Memory : ブロック内のすべてのスレッドからアクセス可。Gloval Memory より数百倍高速。
local Memory : スレッドからアクセス可。
Gloval Memory : すべてのスレッド&ホストからアクセス可。キャッシュされない。
Shared Memory : ブロック内のすべてのスレッドからアクセス可。Gloval Memory より数百倍高速。
local Memory : スレッドからアクセス可。
※コメント投稿者のブログIDはブログ作成者のみに通知されます