18/08/25 21:04:45.93 DovDn/Ya0.net
>>100
別に勘違いしてないよ
nvidiaが用意するモデルにも興味はあるけど、既に高画質だって分かってるwaifu2xが
Tensorコアを使えるようになってリアルタイムくらいの速さになればいいなって期待してる
Tensorコアはfp16(半精度)で4x4の行列積を演算するコアだよ
convolutionを高速に計算するためにあるんだから、
convolutionがボトルネックになってるwaifu2xも高速化できるはず
今はfp32で演算してるからfp16でも精度がなるべく落ちないようにチューニングする必要はあるだろうけど
Tensorコア使ってconvolutionを計算するところはcuDNNがやってくれるから
書き換えはそんなに大変じゃないと思う