08/07/15 07:52:19
>>105
その通りですシェアードメモリとブロック数が理解できない
1. プロック数
dim3 blocks = dim3(iw/(4*BlockWidth)+(0!=iw%(4*BlockWidth)),
ih/threads.y+(0!=ih%threads.y));
なぜblocks.xはiw/threads.x+(0!=iw%threads.x)じゃなくて
上の式になるのか。
2. シェアードメモリ
int SharedPitch = ~0x3f&(4*(BlockWidth+2*Radius)+0x3f);
int sharedMem = SharedPitch*(threads.y+2*Radius);
SharedPitchはなぜ上の計算になるのか。
0x03fの意味、4*の意味、BlockWidth+2*Radiusの意味が理解できない
とりあえずSharedメモリの使い方はどこを調べればわかるんだ!ウンコ!