中田真秀(なかたまほ)のブログ

研究について、日常について、その他。

Tesla C2050でのdgemmの性能限界は412Gflops

2010-08-04 06:46:53 | 日記
nVidia Tesla C2050の理論性能値は

公称515Gflopsとなっている。これは単純にCUDA コア数とCUDA コア周波数をかけたものとなっている。

448(個) * 1.15GHz = 515.20 Gflops

後藤さんによると、CPUの場合、dgemmは理論性能値の95%がでるが、GPUの場合は80%が限界なんだそうだ。

したがって

1.15*448*0.8 = 412.160 Gflops

のパフォーマンスが出たらここらへんがチューニングの限界、ということなんだそうだ。

最新の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
Unknown (後藤)
2010-08-06 09:02:00
誤解を招きかねない書き方なので補足を。
Nehalem, Penryn の場合には 96.9% が理論限界値、80% というのは GPU というより Fermi ね。
返信する
Unknown (Nakata Maho)
2010-08-06 09:58:20
コメントどうもありがとうございます! ほんとうに勉強になります。
返信する

コメントを投稿