【GPGPU】くだすれCUDAスレ part7【NVIDIA】

【GPGPU】くだすれCUDAスレ part7【NVIDIA】at TECH

【GPGPU】くだすれCUDAスレ part7【NVIDIA】 - 暇つぶし2ch977:デフォルトの名無しさん
16/05/01 10:04:45.15 c2Ftkl1w.net
>>950
thx。

調べてみた感じだと、倍精度が無いカードで暗黙のdouble→floatキャストがあったり、
floatへの数値代入で接尾語Fを付けないとdoubleにキャストされたりもあるっぽいね。

fermiでarch=compute_20,sm_20指定してるから基本的には宣言通りだと思ったのだが、実際どうなってるのか・・。
全部floatに置き換えてもわずかしかスピードアップしないのは、バイトコピー分が浮いてるだけな気がする。

次ページ

続きを表示

1を表示