Core i7 920の公称flopsの計算方法は次のようであると推察される。
周波数x4 (コア) x 4 (加算器/core)
この場合、2.66 x 4 x 4 = 42.56である。
さらに、TurboBoostが効く場合は、
2.8 x 4 x 4 = 44.8
インテルが出している公称flopsは
ここから読めるが、これと完全に合致した。
GotoBLAS2 1.13 on Corei7 920でパフォーマンス測定した。
Turbo Boost off で、dgemmの性能が40.6GFlopsとなった。これはピークの95%程度である。
Turbo Boost on では、dgemmの性能が42.0-42.7GFlopsとなった。これはピークの93.8% - 95.3%である。
ちなみに「インテル® マイクロプロセッサー製品の輸出規制基準」と銘打ってある。きっとピーク性能は輸出入に関する規制基準になるのだろう。
2010/4/12追記: TurboBoostにふれた。文章微調整。
周波数x4 (コア) x 4 (加算器/core)
この場合、2.66 x 4 x 4 = 42.56である。
さらに、TurboBoostが効く場合は、
2.8 x 4 x 4 = 44.8
インテルが出している公称flopsは
ここから読めるが、これと完全に合致した。
GotoBLAS2 1.13 on Corei7 920でパフォーマンス測定した。
Turbo Boost off で、dgemmの性能が40.6GFlopsとなった。これはピークの95%程度である。
Turbo Boost on では、dgemmの性能が42.0-42.7GFlopsとなった。これはピークの93.8% - 95.3%である。
ちなみに「インテル® マイクロプロセッサー製品の輸出規制基準」と銘打ってある。きっとピーク性能は輸出入に関する規制基準になるのだろう。
2010/4/12追記: TurboBoostにふれた。文章微調整。
TurboBoost が効いているので本当の理論性能は不明。厳密に測定するためにはパフォーマンスカウンタを使う必要がある(rdtsc や gettimeofday では駄目)。
何を使えば良いのでしょうか。
現在、gettimeofday使ってます。getrusageもつかいましたが、コア分もよけいに測定するようです。
ついでに最近の省電力機能(Frequency Scaling)が enable だとやっぱり性能がブレるので、これも disable するのが良。
thanks!