Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.s
【摘要】 @[toc] 问题描述Begin to resume from the last checkpoint.Loading checkpoint from out/total3d/20110611514267/model_best.pth.Warning: Could not find epoch in checkpoint!Warning: Could not find min_loss in...
@[toc]
问题描述
Begin to resume from the last checkpoint.
Loading checkpoint from out/total3d/20110611514267/model_best.pth.
Warning: Could not find epoch in checkpoint!
Warning: Could not find min_loss in checkpoint!
Warning: Could not find step in checkpoint!
set() subnet missed.
Checkpoint out/total3d/20110611514267/model_best.pth resumed.
----------------------------------------------------------------------------------------------------
Loading data.
Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory
原因
没有安装cudnn,或者没有配置cudnn。
解决方法
执行命令:
sudo apt install nvidia-cudnn
NVIDIA cuDNN
NVIDIA CUDA® 深度神经网络库 (cuDNN) 是一个 GPU 加速的深度神经网络基元库,能够以高度优化的方式实现标准例程(如前向和反向卷积、池化层、归一化和激活层)。
全球的深度学习研究人员和框架开发者都依赖 cuDNN 来实现高性能 GPU 加速。借助 cuDNN,研究人员和开发者可以专注于训练神经网络及开发软件应用,而不必花时间进行低层级的 GPU 性能调整。cuDNN 可加速广泛应用的深度学习框架,包括 Caffe2、Chainer、Keras、MATLAB、MxNet、PaddlePaddle、PyTorch 和 TensorFlow。
显存占用,未被释放。
问题描述
显存没有被释放,也查不到哪个进程再用。
解决方法
执行命令,查找哪个进程占用了。
fuser -v /dev/nvidia*
然后,结束进程,执行命令:
kill -9 131786
专栏目录:神经网络精讲与实战
这篇文章,是对专栏的总目录,方便大家查看文章。这个专栏我计划整理一些经典常用的主干网络模型,对其进行讲解和实战。由浅入深,逐步增加深度,让大家更容易接受。
PDF版的文章和实战代码以及数据集,我会放到网盘上,大家在文章的末尾可以看到。
AlexNet
VGGNet
GoogLeNet
Inception V2——V4
第十六篇 Inception V2、Inception V3、Inception V4模型详解
ResNet
DenseNet
SE-ResNet
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)