我写了这样的示例代码.
int ** d_ptr; cudaMalloc( (void**)&d_ptr, sizeof(int*)*N ); int* tmp_ptr[N]; for(int i=0; i这段代码运行良好但在内核启动后我无法收到结果.
int* Mtx_on_GPU[N]; cudaMemcpy(Mtx_on_GPU, d_ptr, sizeof(int)*N*SIZE, cudaMemcpyDeviceToHost);此时,发生段错误错误.但我不知道我错了什么.
int* Mtx_on_GPU[N]; for(int i=0; i此代码也有相同的错误.
我认为我的代码肯定会有一些错误,但我无法在白天找到它.
给我一些建议.