cudaMemcpy学习笔记

举报
风吹稻花香 发表于 2022/07/31 23:56:28 2022/07/31
【摘要】 主机是电脑Host Device是gpu设备。 cudaMemcpy用于在主机(Host)和设备(Device)之间往返的传递数据,用法如下: 主机到设备:cudaMemcpy(d_A,h_A,nBytes,cudaMemcpyHostToDevice) 设备到主机:cudaMemcpy(h_A,d_A,nBytes,c...

主机是电脑Host

Device是gpu设备。

cudaMemcpy用于在主机(Host)和设备(Device)之间往返的传递数据,用法如下:

主机到设备:cudaMemcpy(d_A,h_A,nBytes,cudaMemcpyHostToDevice)

设备到主机:cudaMemcpy(h_A,d_A,nBytes,cudaMemcpyDeviceToHost)


注意:该函数是同步执行函数,在未完成数据的转移操作之前会锁死并一直占有CPU进程的控制权,所以不用再添加cudaDeviceSynchronize()函数

示例:


  
  1. void VectorReal_copyBuffer(realVecHandle* addr, float hostArr[],long buffer, bool tohost, int copyMode)
  2. {
  3. realVecHandle * native =addr;
  4. float * host = hostArr;
  5. if ( copyMode == 0 ) {
  6. if (!tohost) {
  7. cudaMemcpy( native->data,host, native->size, cudaMemcpyHostToDevice) ;
  8. } else {
  9. cudaMemcpy( host, native->data, native->size, cudaMemcpyDeviceToHost) ;
  10. }
  11. }
  12. }

//显存上分配空间

CUDA_SAFE_CALL(cudaMalloc((void**)&Dst_d,sizeof(float3) * totalPNum));

//显存上传输数据

CUDA_SAFE_CALL(cudaMemcpy(Dst_d, Srcdata0_h, sizeof(float3) * numdata0, cudaMemcpyHostToDevice));
CUDA_SAFE_CALL(cudaMemcpy(Dst_d + numpoint0, Srcdata1_d, sizeof(float3) * numdata1, cudaMemcpyDeviceToDevice));
CUDA_SAFE_CALL(cudaMemcpy(Dst_d + numpoint0 + numpoint1, Srcdata2_d, sizeof(float3) * numdata2, cudaMemcpyDeviceToDevice));

数据传输过程中,目的地址在源地址之前(地址可能有偏移计算,数据源不同目的相同时),对应后面参数,devicetohost 或者 hosttodevice.

原文链接:https://blog.csdn.net/xiaoheibaqi/article/details/44001273

文章来源: blog.csdn.net,作者:AI视觉网奇,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/jacke121/article/details/126079967

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。