cudaMemcpy学习笔记
主机是电脑Host
Device是gpu设备。
cudaMemcpy用于在主机(Host)和设备(Device)之间往返的传递数据,用法如下:
主机到设备:cudaMemcpy(d_A,h_A,nBytes,cudaMemcpyHostToDevice)
设备到主机:cudaMemcpy(h_A,d_A,nBytes,cudaMemcpyDeviceToHost)
注意:该函数是同步执行函数,在未完成数据的转移操作之前会锁死并一直占有CPU进程的控制权,所以不用再添加cudaDeviceSynchronize()函数
示例:
-
void VectorReal_copyBuffer(realVecHandle* addr, float hostArr[],long buffer, bool tohost, int copyMode)
-
{
-
realVecHandle * native =addr;
-
float * host = hostArr;
-
-
if ( copyMode == 0 ) {
-
if (!tohost) {
-
cudaMemcpy( native->data,host, native->size, cudaMemcpyHostToDevice) ;
-
} else {
-
cudaMemcpy( host, native->data, native->size, cudaMemcpyDeviceToHost) ;
-
}
-
}
-
}
//显存上分配空间
CUDA_SAFE_CALL(cudaMalloc((void**)&Dst_d,sizeof(float3) * totalPNum));
//显存上传输数据
CUDA_SAFE_CALL(cudaMemcpy(Dst_d, Srcdata0_h, sizeof(float3) * numdata0, cudaMemcpyHostToDevice));
CUDA_SAFE_CALL(cudaMemcpy(Dst_d + numpoint0, Srcdata1_d, sizeof(float3) * numdata1, cudaMemcpyDeviceToDevice));
CUDA_SAFE_CALL(cudaMemcpy(Dst_d + numpoint0 + numpoint1, Srcdata2_d, sizeof(float3) * numdata2, cudaMemcpyDeviceToDevice));
数据传输过程中,目的地址在源地址之前(地址可能有偏移计算,数据源不同目的相同时),对应后面参数,devicetohost 或者 hosttodevice.
原文链接:https://blog.csdn.net/xiaoheibaqi/article/details/44001273
文章来源: blog.csdn.net,作者:AI视觉网奇,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/jacke121/article/details/126079967
- 点赞
- 收藏
- 关注作者
评论(0)