《深度学习:卷积神经网络从入门到精通》——1.5 卷积神经网络的GPU实现和cuDNN库

举报
华章计算机 发表于 2019/06/05 23:13:56 2019/06/05
【摘要】 本书摘自《深度学习:卷积神经网络从入门到精通》——书中第1章,第1.5节,作者是李玉鑑、张婷、单传辉、刘兆英等。

1.5 卷积神经网络的GPU实现和cuDNN库

只采用CPU在大规模数据集中训练卷积神经网络的速度很慢,因此可以结合图形处理单元(Graphic Processing Unit,GPU)进行加速。GPU具有单指令多数据流结构,非常适合用一个程序处理各种大规模并行数据的计算问题。最常用的GPU是英伟达(Nvidia)生产的。编写GPU代码可在CUDA环境下进行。CUDA(Compute Unif?ied Device Architecture)是一种用于GPU通用计算的并行计算平台和编程模型。它以C语言为基础,并对C语言进行了扩展,能够在显卡芯片上执行程序。CUDA提供了一个深度神经网络的GPU加速库cuDNN(CUDA Deep Neural Network),完成了对卷积、池化、归一化和激活函数层等标准操作的快速实现。如果读者想了解更多的相关信息,可参考以下网站:

https://developer.nvidia.com/cuda-toolkit

https://developer.nvidia.com/deep-learning-software

https://developer.nvidia.com/cudnn


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。