08/07/17 00:02:48
>>115
自前で作成したmemcpy関数(サンプル付き)
記憶で書いているのでデバッグは自分でよろしく
注意:sizeは4の倍数のみ
__device__ void memcpy1D(long* p_dst , const long* p_src , unsigned int size)
{
const long* p_end = p_src + (size >> 2);
p_src += threadIdx.x;
p_dst += threadIdx.x;
while (p_src < p_end)
{
*p_dst = *p_src;
p_src += blockDim.x;
p_dst += blockDim.x;
}
}
__device__ structHogeHoge g_data;
__global__ void sample(void)
{
__shared__ structHogeHoge s_data;
memcpy1D((long*)&s_data , (long*)&g_data , sizeof(s_data));
__syncthreads();
}