最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

cuDNN 7.2

2018年08月24日 00時45分49秒 | Weblog
cuDNN 7.2 を導入してみました。

What’s New in cuDNN 7.2?
Deep learning frameworks using cuDNN 7 and later, can leverage new features and performance of the Volta architecture to deliver up to 6x faster training performance compared to Pascal GPUs. cuDNN 7.2 highlights include:

TensorCore acceleration with FP32 inputs and outputs (previously restricted to FP16 input)
RNN cells now support more use cases with options for cell clipping and padding masks
Automatically select the best RNN implementation with RNN search API

cuDNN Release Notes v7.2.1
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする