Lv.1
xendbcnehd c
更多个人资料
6
成长值
0
关注
0
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
0
6
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
主题
(4)
|
回复
(10)
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
还有你确定这行报错没问题? 23:50:36,290 |-ERROR in ch.qos.logback.core.joran.spi.Interpreter@14:19 - no applicable action for [Encoding], current ElementPath is [[configuration][appender][Encoding]]
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
请问是怎么进行模型端口启动的校验的? 我在本地跑的是: > sudo docker run -p 8076:8080 swr.cn-north-4.myhuaweicloud.com/zhoustar_34791701/tsd14_run:deploy_v40 /bin/bash /home/run.sh 然后,在本地测试是: > curl 127.0.0.1:8076/health> {"health":"true"} 我感觉没啥问题啊。难道还有别的校验?
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
请问是怎么进行模型端口启动的校验的? 我在本地跑的是: > sudo docker run -p 8076:8080 swr.cn-north-4.myhuaweicloud.com/zhoustar_34791701/tsd14_run:deploy_v40 /bin/bash /home/run.sh 然后,在本地测试是: > curl 127.0.0.1:8076/health > {"health":"true"} 我感觉没啥问题啊。难道还有别的校验?
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
评论 BUG_MAKER:专家快来啊,坐等
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
评论 BUG_MAKER:华北四
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
在华北四
自定义镜像部署在线服务和批量服务异常:start service failed, retry later
发布时间
2020/11/16 15:45:58
最后回复
看那个码农
2020/11/18 15:08:07
版块
AI开发平台ModelArts
1962
13
0
他的回复:
回复:HWCloudAI 发表于 2020-11-16 15:57 请稍等,专家正在路上诶这个不能算专家已回复吧
Modelarts 训练任务使用自定义容器
发布时间
2020/11/04 14:40:49
最后回复
xendbcnehd c
2020/11/04 18:56:53
版块
AI开发平台ModelArts
1140
6
0
他的回复:
贴一下报错日志,这种情况, 这个run_train.sh如果要跑起来是不是要装你们的组件在镜像里,比较麻烦。 所以最好的方法是用它还是不用呢?
Modelarts 训练任务使用自定义容器
发布时间
2020/11/04 14:40:49
最后回复
xendbcnehd c
2020/11/04 18:56:53
版块
AI开发平台ModelArts
1140
6
0
他的回复:
回复:静河小G 发表于 2020-11-4 16:36 这位同学你好,run_train.sh执行的操作是将你的配置的代码目录(整个文件夹)从OBS当中下载到容器的/home/work/user-job-dir下面,关于基础镜像, 如果只是安装cuda的问题, nvidia-docker等等网上各种资源直接用不香吗,你们又规定了基础镜像。你们还设置了镜像大小限定9.5G,我第一次装个pytorch1.6+cuda10.1直接就超了。后来降级到1.4+cuda9.2才满足要求。希望你们考虑这种情况。
Modelarts 训练任务使用自定义容器
发布时间
2020/11/04 14:40:49
最后回复
xendbcnehd c
2020/11/04 18:56:53
版块
AI开发平台ModelArts
1140
6
0
他的回复:
回复:静河小G 发表于 2020-11-4 16:36 这位同学你好,run_train.sh执行的操作是将你的配置的代码目录(整个文件夹)从OBS当中下载到容器的/home/work/user-job-dir下面,至少说临时分配的硬盘能不能设计在训练任务后保存?这样也利于debug