研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

最短路ソルバーのボトルネック。

2009-02-16 22:08:59 | Weblog
後藤さんから頂いたプログラムの実行結果の抜粋。(ずいぶん温めてきてしまいましたが)このプログラムでは、2スレッドで同じ領域のデータを参照していく際のメモリバンド幅を測定している。L2 キャッシュに乗るであろうサイズの場所を見ていくと、L2 共有コア同士では他の場合と比べ 16 % ほど性能が低下している。2プロセス同時実行では 21 % ほどであるので、これがボトルネックの主要原因であるといえる。

最新の画像もっと見る

コメントを投稿