バケット法に行った実験と同様な実験をこちらにも行った。ヒープ法では、バケット法と比べ、全体的になだらかである。
「ダイが異なるコア同士」、「L2 を共有してはいないが同一ダイ上のコア同士」では、影響を見せない。前者から L2 上に作業領域がのっていること、後者から2プロセスでもバンド幅を使い切らないことがわかる。
同一ダイ上ではやはり低速化してしまうために、以下のサイズということがわかる。
3MB ≦ ヒープ ≦ 4MB
しかしながら、全米グラフでもヒープは最大でも 8000 要素ほどしか格納されていない。8000 x 16 = 2^17 = 128 KB なので、上は大きすぎる。ヒープ自体は密であるが、アクセスは疎になってしまうために、無駄なロードが原因だろう。
「ダイが異なるコア同士」、「L2 を共有してはいないが同一ダイ上のコア同士」では、影響を見せない。前者から L2 上に作業領域がのっていること、後者から2プロセスでもバンド幅を使い切らないことがわかる。
同一ダイ上ではやはり低速化してしまうために、以下のサイズということがわかる。
3MB ≦ ヒープ ≦ 4MB
しかしながら、全米グラフでもヒープは最大でも 8000 要素ほどしか格納されていない。8000 x 16 = 2^17 = 128 KB なので、上は大きすぎる。ヒープ自体は密であるが、アクセスは疎になってしまうために、無駄なロードが原因だろう。