最短経路問題では巨大なデータ(全米グラフはテキストデータで5800万行, 1.3Gbyte)を用いるために、メモリアクセスがボトルネックであると思っていたのだが、実はそうでなかった。
先日のゼミで指摘されたことだが、マルチコアで線形に性能が伸びるということは、メモリアクセスがボトルネックではないとのこと。しかしながら、コアを変化させて見ていくと性能が下がってしまうところがある。
よって、L2 キャッシュサイズがボトルネックであることがわかる。ただ、penryn 系コアの L2 キャッシュサイズは、6MB とかなり大きいので、現状に満足できない。まだまだ高速化できる。
先日のゼミで指摘されたことだが、マルチコアで線形に性能が伸びるということは、メモリアクセスがボトルネックではないとのこと。しかしながら、コアを変化させて見ていくと性能が下がってしまうところがある。
よって、L2 キャッシュサイズがボトルネックであることがわかる。ただ、penryn 系コアの L2 キャッシュサイズは、6MB とかなり大きいので、現状に満足できない。まだまだ高速化できる。