- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【MindSpore】Ubuntu16.04上成功安装GPU版MindSpore1.0.1

PepperG 发表于 2020/12/11 22:48:59 2020/12/11

【摘要】本文是在宿主机Ubuntu16.04上拉取cuda10.1-cudnn7-ubuntu18.04的镜像，在容器中通过Miniconda3创建python3.7.5的环境并成功安装mindspore_gpu_1.0.1；一、前期踩过的坑二、安装成功的流程【1】拉取cuda10.1-cudnn7-ubuntu18.04的镜像【2】镜像内创建容器,此处一定是nvidia-docker创...

本文是在宿主机Ubuntu16.04上拉取cuda10.1-cudnn7-ubuntu18.04的镜像，在容器中通过Miniconda3创建python3.7.5的环境并成功安装mindspore_gpu_1.0.1；

一、前期踩过的坑

二、安装成功的流程

【1】拉取cuda10.1-cudnn7-ubuntu18.04的镜像
【2】镜像内创建容器,此处一定是nvidia-docker创建
【3】在容器内安装Miniconda
【4】使用conda创建python3.7.5的虚拟环境并激活
【5】通过可执行文件安装mindspore_gpu_1.0.1.whl并测试

一、前期踩过的坑

在ubuntu上安装GPU版本mindspore的具体流程

主要有以下几点：

1. Ubuntu18.04（系统版本至少为18.04及以上）：
基于我使用的是共用版Ubuntu16.04的服务器，无法直接升级，只能通过容器方式，拉取Ubuntu18.04的镜像；

2. cuda10.1 （cuda版本必须为10.1）：
3. cudnn >= 7.6 （cudnn7.6.5可行，但cudnn8是会报错的）：

因Nvidia提供了[cuda+cudnn+ubuntu的镜像](https://hub.docker.com/r/nvidia/cuda)，
所以可以一次性拉取需要的cuda10.1-cudnn7-ubuntu18.04的镜像;

因要求的是cudnn>=7.6，所以最开始拉取的是cudnn8版本的，一直报错 `libcudnn.so.7: cannot open shared object file: No such file or directory` ，后改为cudnn7版本就没报错了；

4. devel和runtime版本区别：本文选择devel版

找到cuda10.1-cudnn7-ubuntu18.04，（cudnn7它标明的是cudnn7.6.5）发现有两个版本cuda devel和cuda runtime：

官方解释：
devel是说只涵盖了开发bai所需的所有工具，包含编译、debug等，以及编译需要的头文件、静态库。
runtime是说只涵盖了运行环境的最小集合，例如动态库等
所以runtime的镜像大小会比devel小一些

5. docker与nvidia-docker的区别：

docker创建的容器里需要再次安装nvidia-driver，且需要容器里的nvidia-driver版本与宿主机里的nvidia-driver版本一致，才能在容器里使用GPU；

nvidia-docker创建的容器，只需要在宿主机上安装nvidia-driver，容器内就可以直接使用GPU；

安装nvidia-docker之前必须在宿主机上安装nvidia-driver和docker；

nvidia-smi                     # 检查宿主机是否安装了 nvidia-driver
docker version              # 检查宿主机上安装的docker版本
nvidia-docker version   # 检查宿主机上安装的nvidia-docker版本

二、安装成功的流程

【1】拉取nvidia/cuda:10.1-cudnn8-devel-ubuntu18.04的镜像

为避免不必要的错误，后续使用的全部都是nvidia-docker

选择**devel**版本

nvidia-docker pull nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04

【2】镜像内创建容器**此处一定是nvidia-docker创建**

nvidia-docker run -it nvidia/cuda:10.1-cudnn7-devel-ubuntu18.04 /bin/bash

【3】在容器内安装Miniconda

因为在容器内使用wget下载miniconda一直失败，所以选择在windows上下载并上传至ubuntu宿主机上，再从ubuntu宿主机上拷贝至容器内；

nvidia-docker  cp  miniconda3.sh路径   containerID:/     #  退出容器，并将miniconda3.sh 文件拷贝至容器根目录下

nvidia-docker  start containerID                         # 启动容器并进入
nvidia-docker exec -it containerID  /bin/bash

bash  Miniconda3-latest-Linux-x86_64.sh                  # 安装miniconda3

【4】使用conda创建python3.7.5的虚拟环境并激活
安装miniconda后需先退出容器再进入，才能再容器中使用conda

conda create -n mindspore1.0.1 python=3.7.5   # conda create -n  虚拟环境名  指定python版本

conda activate mindspore1.0.1    # 激活指定环境

windows上下载mindspore_gpu_1.0.1.whl,并拷贝至容器内；

【5】通过可执行文件安装mindspore_gpu_1.0.1.whl并测试；

pip install mindspore_gpu-1.0.1-cp37-cp37m-linux_x86_64.whl

安装完成后，在python环境下执行以下代码

import numpy as np
from mindspore import Tensor
from mindspore.ops import functional as F
import mindspore.context as context

context.set_context(device_target="GPU")
x = Tensor(np.ones([1,3,3,4]).astype(np.float32))
y = Tensor(np.ones([1,3,3,4]).astype(np.float32))
print(F.tensor_add(x, y))

如果出现以下，则说明安装成功：

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

【MindSpore】Ubuntu16.04上成功安装GPU版MindSpore1.0.1

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

推荐阅读

相关产品