RuntimeError: CUDNN_STATUS_EXECUTION_FAILED |【❤️有效解决❤️】

举报
墨理学AI 发表于 2022/01/21 22:31:54 2022/01/21
【摘要】 文章目录 🥇 报错汇总📔 RuntimeError: CUDNN_STATUS_EXECUTION_FAILED🟧 理论上的解决方法🟦 临时解决方法、暂时关闭Cudnn 加速【经测试,该错...


🥇 报错汇总


📔 RuntimeError: CUDNN_STATUS_EXECUTION_FAILED

使用 GPU 训练或者测试 加载模型遇到如下报错

RuntimeError: CUDNN_STATUS_EXECUTION_FAILED
🟧 理论上的解决方法
  • 正确适配 Cuda 、Cudnn 和 当前深度学习框架的版本【tensorflow 或者 Pytorch】
  • Conda 独立环境中可使用 conda install cudatoolkit=x.0 安装正确的 cudatoolkit 版本来解决

首先 search 当前可以安装的 cudatoolkit

conda search cudatoolkit

Loading channels: done
Name                       Version                   Build  Channel        
cudatoolkit                5.5rc1                       p0  defaults       
cudatoolkit                5.5.1                        p0  defaults       
cudatoolkit                6.0                          p0  defaults       
cudatoolkit                7.0                           1  defaults       
cudatoolkit                7.5                           0  defaults       
cudatoolkit                7.5                           2  defaults       
cudatoolkit                8.0                           1  defaults       
cudatoolkit                8.0                           3  defaults       
cudatoolkit                9.0                  h13b8566_0  defaults       
cudatoolkit                9.2                           0  defaults       
cudatoolkit                10.0.130                      0  defaults       
cudatoolkit                10.1.168                      0  defaults       
cudatoolkit                10.1.243             h6bb024c_0  defaults       
cudatoolkit                10.2.89              hfd86e86_0  defaults       
cudatoolkit                10.2.89              hfd86e86_1  defaults       
cudatoolkit                11.0.221             h6bb024c_0  defaults       
cudatoolkit                11.3.1               h2bc3f7f_2  defaults    

故而,当前可以考虑采用的安装命令有【我会根据Pytorch版本适配需求安装即可】

  • conda install cudatoolkit=7.0
  • conda install cudatoolkit=8.0
  • conda install cudatoolkit=9.0
  • conda install cudatoolkit=10.0.*
  • conda install cudatoolkit=11.0.*
🟦 临时解决方法、暂时关闭Cudnn 加速【经测试,该错误会消失,方式如下】
import torch
torch.backends.cudnn.enabled = False

📕 RuntimeError: cublas runtime error

这个报错仅作记录【大部分人应该遇不到 或者 和我的这个报错不一致】

RuntimeError: cublas runtime error : the GPU program failed to execute at /opt/conda/conda-bld/pytorch_1525909934016/work/aten/src/THC/THCBlas.cu:249

简单分析如下

  • 实际解决方式:换一台 感觉的服务器,重新 搭建环境 【默认不会安装 TVM、TensorRT等库】,该报错即消失

1-0

📗 conda list 发现多个版本 numpy

conda list 查看当前的 库版本

1-1

原因是,环境搭建过程中,Conda 和 pip 安装库 交叉使用,Conda 安装的 numpy 库,pip 安装其它版本时候,pip 无法卸载之前 Conda 安装的 ;这种情况通常不影响环境 numpy 版本的正常使用

## 如果有影响,则需要卸载掉不需要的库

pip uninstall numpy

## 或者

conda uninstall numpy

📘 conda 源导致的报错

Solving environment: failed

CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.ustc.edu.cn/anaconda/pkgs/main/noarch/repodata.json>
Elapsed: -

An HTTP error occurred when trying to retrieve this URL.
HTTP errors are often intermittent, and a simple retry will get you on your way.
SSLError(MaxRetryError('HTTPSConnectionPool(host=\'mirrors.bfsu.edu.cn\', port=443): Max retries exceeded with url: /anaconda/pkgs/main/noarch/repodata.json (Caused by SSLError(SSLError("bad handshake: Error([(\'SSL routines\', \'ssl3_get_server_certificate\', \'certificate verify failed\')],)",),))',),)

原因是 当前的conda 源响应失败 或者 找不到对应版本库


解决方法如下

  • 换回默认源
conda config --remove-key channels
  • 或者:配置镜像 Conda 源

❤️ anaconda conda 切换为国内源 |windows 和 Linux配置方法 | 添加清华源|


9-6


文章来源: positive.blog.csdn.net,作者:墨理学AI,版权归原作者所有,如需转载,请联系作者。

原文链接:positive.blog.csdn.net/article/details/120903101

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。