Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.s

举报
AI浩 发表于 2023/08/01 14:23:12 2023/08/01
【摘要】 @[toc] 问题描述Begin to resume from the last checkpoint.Loading checkpoint from out/total3d/20110611514267/model_best.pth.Warning: Could not find epoch in checkpoint!Warning: Could not find min_loss in...

@[toc]

问题描述

Begin to resume from the last checkpoint.
Loading checkpoint from out/total3d/20110611514267/model_best.pth.
Warning: Could not find epoch in checkpoint!
Warning: Could not find min_loss in checkpoint!
Warning: Could not find step in checkpoint!
set() subnet missed.
Checkpoint out/total3d/20110611514267/model_best.pth resumed.
----------------------------------------------------------------------------------------------------
Loading data.
Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory

原因

没有安装cudnn,或者没有配置cudnn。

解决方法

执行命令:

sudo apt install nvidia-cudnn

NVIDIA cuDNN

NVIDIA CUDA® 深度神经网络库 (cuDNN) 是一个 GPU 加速的深度神经网络基元库,能够以高度优化的方式实现标准例程(如前向和反向卷积、池化层、归一化和激活层)。

全球的深度学习研究人员和框架开发者都依赖 cuDNN 来实现高性能 GPU 加速。借助 cuDNN,研究人员和开发者可以专注于训练神经网络及开发软件应用,而不必花时间进行低层级的 GPU 性能调整。cuDNN 可加速广泛应用的深度学习框架,包括 Caffe2、Chainer、Keras、MATLAB、MxNet、PaddlePaddle、PyTorch 和 TensorFlow。
在这里插入图片描述

显存占用,未被释放。

问题描述

显存没有被释放,也查不到哪个进程再用。

在这里插入图片描述

解决方法

执行命令,查找哪个进程占用了。

fuser -v /dev/nvidia*

在这里插入图片描述

然后,结束进程,执行命令:

kill -9 131786

专栏目录:神经网络精讲与实战

这篇文章,是对专栏的总目录,方便大家查看文章。这个专栏我计划整理一些经典常用的主干网络模型,对其进行讲解和实战。由浅入深,逐步增加深度,让大家更容易接受。

PDF版的文章和实战代码以及数据集,我会放到网盘上,大家在文章的末尾可以看到。

AlexNet

第一篇 AlexNet——论文翻译

第二篇 AlexNet——模型精讲

第三篇 制作数据集

第四篇 AlexNet——网络实战
在这里插入图片描述

VGGNet

第五篇 VGGNet——论文翻译

第六篇 VGGNet——模型精讲

第七篇 图像分类的评价指标

第八篇 VGGNet——网络实战
在这里插入图片描述

GoogLeNet

第九篇 GoogLeNet——论文翻译

第十篇 GoogLeNet——模型精讲

第十一篇 绘图matplotlib.pyplot的使用

第十二篇 GoogLeNet——网络实战
在这里插入图片描述

Inception V2——V4

第十三篇 Inception V2——论文翻译

第十四篇 Inception V3——论文翻译

第十五篇 Inception V4——论文翻译

第十六篇 Inception V2、Inception V3、Inception V4模型详解

第十七篇 PyTorch学习率调整策略

第十八篇 InceptionV3实战

ResNet

第十九篇 ResNet——论文翻译

第二十篇 ResNet——模型讲解

第二十一篇 数据增强

第二十二篇 ResNet实战
在这里插入图片描述

DenseNet

第二十三篇 DenseNet——论文翻译

第二十四篇 DenseNet——模型讲解

第二十五篇 argparse模块

第二十六篇 DenseNet实战

在这里插入图片描述

SE-ResNet

第二十七篇 SeNet——论文翻译

第二十八篇 SeNet模型解析

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。