09/12/26 18:03:48
>>421
>Device 0: "GeForce 8600 GTS"
>Total number of registers available per block: 8192
直訳すると、「ブロックあたり使用可能なレジスター数:8192」
ブロックあたりのスレッド数は数千・数万もいらない。
128~256程度でだいたいパフォーマンスは出る。(それを複数コアで何セットも同時に動かす)
あとカーネル1個でなんでもかんでもするもんでもない。(直列的な)処理ごとに分割すればいい。