RuntimeError: CUDNN_STATUS_EXECUTION_FAILED |【❤️有效解决❤️】
【摘要】
文章目录
🥇 报错汇总📔 RuntimeError: CUDNN_STATUS_EXECUTION_FAILED🟧 理论上的解决方法🟦 临时解决方法、暂时关闭Cudnn 加速【经测试,该错...
文章目录
🥇 报错汇总
📔 RuntimeError: CUDNN_STATUS_EXECUTION_FAILED
使用 GPU 训练或者测试 加载模型遇到如下报错
RuntimeError: CUDNN_STATUS_EXECUTION_FAILED
🟧 理论上的解决方法
- 正确适配 Cuda 、Cudnn 和 当前深度学习框架的版本【tensorflow 或者 Pytorch】
- Conda 独立环境中可使用
conda install cudatoolkit=x.0
安装正确的cudatoolkit
版本来解决
首先 search 当前可以安装的 cudatoolkit
conda search cudatoolkit
Loading channels: done
Name Version Build Channel
cudatoolkit 5.5rc1 p0 defaults
cudatoolkit 5.5.1 p0 defaults
cudatoolkit 6.0 p0 defaults
cudatoolkit 7.0 1 defaults
cudatoolkit 7.5 0 defaults
cudatoolkit 7.5 2 defaults
cudatoolkit 8.0 1 defaults
cudatoolkit 8.0 3 defaults
cudatoolkit 9.0 h13b8566_0 defaults
cudatoolkit 9.2 0 defaults
cudatoolkit 10.0.130 0 defaults
cudatoolkit 10.1.168 0 defaults
cudatoolkit 10.1.243 h6bb024c_0 defaults
cudatoolkit 10.2.89 hfd86e86_0 defaults
cudatoolkit 10.2.89 hfd86e86_1 defaults
cudatoolkit 11.0.221 h6bb024c_0 defaults
cudatoolkit 11.3.1 h2bc3f7f_2 defaults
故而,当前可以考虑采用的安装命令有【我会根据Pytorch版本适配需求安装即可】
- conda install cudatoolkit=7.0
- conda install cudatoolkit=8.0
- conda install cudatoolkit=9.0
- conda install cudatoolkit=10.0.*
- conda install cudatoolkit=11.0.*
🟦 临时解决方法、暂时关闭Cudnn 加速【经测试,该错误会消失,方式如下】
import torch
torch.backends.cudnn.enabled = False
📕 RuntimeError: cublas runtime error
这个报错仅作记录【大部分人应该遇不到 或者 和我的这个报错不一致】
RuntimeError: cublas runtime error : the GPU program failed to execute at /opt/conda/conda-bld/pytorch_1525909934016/work/aten/src/THC/THCBlas.cu:249
简单分析如下
- 实际解决方式:换一台 感觉的服务器,重新 搭建环境 【默认不会安装 TVM、TensorRT等库】,该报错即消失
📗 conda list 发现多个版本 numpy
conda list 查看当前的 库版本
原因是,环境搭建过程中,Conda 和 pip 安装库 交叉使用,Conda 安装的 numpy 库,pip 安装其它版本时候,pip 无法卸载之前 Conda 安装的 ;这种情况通常不影响环境 numpy 版本的正常使用
## 如果有影响,则需要卸载掉不需要的库
pip uninstall numpy
## 或者
conda uninstall numpy
📘 conda 源导致的报错
Solving environment: failed
CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.ustc.edu.cn/anaconda/pkgs/main/noarch/repodata.json>
Elapsed: -
An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.
SSLError(MaxRetryError('HTTPSConnectionPool(host=\'mirrors.bfsu.edu.cn\', port=443): Max retries exceeded with url: /anaconda/pkgs/main/noarch/repodata.json (Caused by SSLError(SSLError("bad handshake: Error([(\'SSL routines\', \'ssl3_get_server_certificate\', \'certificate verify failed\')],)",),))',),)
原因是 当前的conda 源响应失败 或者 找不到对应版本库
解决方法如下
- 换回默认源
conda config --remove-key channels
- 或者:配置镜像 Conda 源
❤️ anaconda conda 切换为国内源 |windows 和 Linux配置方法 | 添加清华源|
文章来源: positive.blog.csdn.net,作者:墨理学AI,版权归原作者所有,如需转载,请联系作者。
原文链接:positive.blog.csdn.net/article/details/120903101
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)