最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPARA : GPU 性能差

2021年09月11日 21時13分21秒 | Weblog

SDPARA 7.6.1 による性能結果。

倍精度演算が中心なので、Tesla P100 x 2枚 の方が GeForce RTX 3090 x 4枚 よりもかなり速い。

 

NVIDIA Tesla P100 x 2 枚

[gpdpotrf] ### END n=152928, nb=2048, 1x2 procs, ver 50: 360.362sec --> 3308.272GFlops ###

 

NVIDIA GeForce RTX 3090 x 4枚

[gpdpotrf] ### END n=152928, nb=2048, 2x2 procs, ver 50: 636.905sec --> 1871.825GFlops ###

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« gcc 11.2.1 | トップ | インテル、新CPU投入へ 半導... »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

Weblog」カテゴリの最新記事