中田真秀(なかたまほ)のブログ

研究について、日常について、その他。

Core i7公称flopsの計算方法推察周波数x4 (コア) x 4(加算器/コア)

2010-04-09 08:44:41 | 日記
Core i7 920の公称flopsの計算方法は次のようであると推察される。

周波数x4 (コア) x 4 (加算器/core)
この場合、2.66 x 4 x 4 = 42.56である。
さらに、TurboBoostが効く場合は、
2.8 x 4 x 4 = 44.8
インテルが出している公称flopsは
ここから読めるが、これと完全に合致した。

GotoBLAS2 1.13 on Corei7 920でパフォーマンス測定した。
Turbo Boost off で、dgemmの性能が40.6GFlopsとなった。これはピークの95%程度である。
Turbo Boost on では、dgemmの性能が42.0-42.7GFlopsとなった。これはピークの93.8% - 95.3%である。

ちなみに「インテル® マイクロプロセッサー製品の輸出規制基準」と銘打ってある。きっとピーク性能は輸出入に関する規制基準になるのだろう。

2010/4/12追記: TurboBoostにふれた。文章微調整。

最新の画像もっと見る

4 コメント

コメント日が  古い順  |   新しい順
Unknown (後藤)
2010-04-09 23:05:53
> dgemmの性能が42.1-42.6GFlopsとなった

TurboBoost が効いているので本当の理論性能は不明。厳密に測定するためにはパフォーマンスカウンタを使う必要がある(rdtsc や gettimeofday では駄目)。
返信する
Unknown (中田)
2010-04-11 07:37:13
TurboBoost、すっかり忘却してました。

何を使えば良いのでしょうか。

現在、gettimeofday使ってます。getrusageもつかいましたが、コア分もよけいに測定するようです。
返信する
Unknown (後藤)
2010-04-12 16:14:52
BIOS で diable するのが一番。理論考察では disable にして理論との整合性を検証し、最後のベンチマークで enable にするとよい。
ついでに最近の省電力機能(Frequency Scaling)が enable だとやっぱり性能がブレるので、これも disable するのが良。

返信する
Unknown (中田)
2010-04-13 08:53:46
確かにBIOSでdisableできますね。試してみたら確かに少しパフォーマンスが落ちました。Frequency scalingも見てみます...

thanks!
返信する

コメントを投稿