17/05/11 11:48:02.00 TYy5LhQm.net
深層学習 従来比 12倍の速度で処理
[GTC 2017]NVIDIA,Volta世代の数値演算アクセラレータ「Tesla V100」を発表。
URLリンク(www.4gamer.net)
* 演算性能はFP64(倍精度浮動小数点演算)が7.5 TFLOPS,FP32(単精度浮動小数点演算)が
* 15 TFLOPS。さらにTesla V100は深層学習のアクセラレーションを行うため4x4のマトリックス演算を
* 行う「New Tensor Core」を持ち,これにより最大120 TFLOPSの演算性能を実現するとのことだ。
* Huang氏は,このNew Tensor Coreによって,Googleの深層学習フレームワーク「Tensor Flow」は
* 従来比で12倍の速度で処理できると語っていた。