後藤さんから頂いたプログラムの実行結果の抜粋。(ずいぶん温めてきてしまいましたが)このプログラムでは、2スレッドで同じ領域のデータを参照していく際のメモリバンド幅を測定している。L2 キャッシュに乗るであろうサイズの場所を見ていくと、L2 共有コア同士では他の場合と比べ 16 % ほど性能が低下している。2プロセス同時実行では 21 % ほどであるので、これがボトルネックの主要原因であるといえる。
最新の画像[もっと見る]
- 自己紹介(last update: 2014.04.15) 10年前
- 自己紹介(last update: 2014.04.15) 10年前
- Graph500, Green Graph 500 (June 2013) 11年前
- Intel コンパイラ -xHost オプション 12年前
- Intel コンパイラ -xHost オプション 12年前
- Graph500 / GreenGraph500 Nov. 2012 12年前
- 1 node Graph500 その5 12年前
- 1 node Graph500 その5 12年前
- 1 node Graph500 その5 12年前
- 1 node Graph500 その4 12年前
※コメント投稿者のブログIDはブログ作成者のみに通知されます