Centos配置nvidia docker
假设当前通过华为云ecs上购买了一台带t4卡的ecs服务器,通过这台ecs服务器来构建推理的自定义镜像。
配置yum源
https://mirrors.huaweicloud.com/
一定不要忘记执行
yum clean all
yum makecache
安装docker
https://www.runoob.com/docker/centos-docker-install.html
选择手动安装流程
sudo yum install -y yum-utils \ sudo yum-config-manager \ 安装的版本是 yum install docker-ce-18.06.3.ce-3.el7 containerd.io sudo systemctl start docker |
安装nvidia-docker
https://zhuanlan.zhihu.com/p/120047324
distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.repo yum install -y nvidia-container-toolkit nvidia-docker2 systemctl restart docker |
安装之后会配置好`/etc/docker/daemon.json`
修改后
{ "insecure-registries":[], "registry-mirrors": ["https://docker.mirrors.ustc.edu.cn/"], "max-concurrent-downloads": 10, "max-concurrent-uploads": 20, "default-runtime": "nvidia", "runtimes": { "nvidia": { "path": "nvidia-container-runtime", "runtimeArgs": [] } } } |
启动命令
# 方式1 nvidia-docker run -it --runtime=nvidia ubuntu:16.04 bash # 方式2 nvidia-docker run -it -e NVIDIA_VISIBLE_DEVICES=all ubuntu:16.04 bash # 方式3 # 在daemon.json配置了 default-runtime=“nvidia” docker run -it -e NVIDIA_VISIBLE_DEVICES=all ubuntu:16.04 bash # build 镜像(还需要自行测试) nvidia-docker build -t nvidia-test:v1 . docker build -e NVIDIA_VISIBLE_DEVICES=all -t nvidia-test:v1 . |
docker的环境变量例如PATH设置需要通过ENV命令来设置
推理使用到的gpu docker镜像,可以在git hub上搜索cuda,能够找到已经打包好的docker镜像通过名字就可以看出对应的cuda版本cudnn版本,操作系统版本。通过docker pull拉下来。基于这个基础镜像构建自己的服务。
- 点赞
- 收藏
- 关注作者
评论(0)