Lv.1
frag
更多个人资料
0
成长值
1
关注
0
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
0
0
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
主题
(0)
|
回复
(26)
8卡Ascend训练作业问题求助
发布时间
2020/11/09 17:38:14
最后回复
AI_学习者
2020/11/09 19:56:33
版块
AI开发平台ModelArts
1155
6
0
他的回复:
评论 AI_学习者:我理解是在一个容器下的,可以共享数据
训练作业 - TF1.15 Ascend 8卡 - 环境遇到错误
发布时间
2020/09/17 22:44:04
最后回复
KKKGo
2020/10/20 15:50:23
版块
AI开发平台ModelArts
5249
7
0
他的回复:
你代码里做all-reduce的时候,rank下标是从0还是1开始的?
训练作业 - TF1.15 Ascend 8卡 - 环境遇到错误
发布时间
2020/09/17 22:44:04
最后回复
KKKGo
2020/10/20 15:50:23
版块
AI开发平台ModelArts
5249
7
0
他的回复:
代码上看起来除了用了NPUOptimizer其他也没啥了,有更详细的报错吗,或者你换成普通optimizer能在gpu上跑么?
市场订阅里的YOLOv3_ResNet18训练提交不上
发布时间
2020/09/15 11:18:28
最后回复
名字好难
2020/09/15 14:49:11
版块
AI开发平台ModelArts
1439
3
0
他的回复:
你这边用的yolov3是d芯片上跑的,你是不是没有申请d公测的权限
自动训练物体检测功能,提交训练后提示训练失败,请联系工作人员。
发布时间
2020/09/14 13:36:51
最后回复
RoyalKun
2020/09/15 09:08:42
版块
AI开发平台ModelArts
4974
11
1
他的回复:
这边看了下,是因为你的数据中,有图片没有标注,所以失败了
【AI市场】【中文文本分类-Bert】D芯片推理时只支持256和320
发布时间
2020/09/04 17:13:41
最后回复
woyuRT
2020/09/11 17:57:35
版块
AI开发平台ModelArts
1537
6
0
他的回复:
这里写仅支持256和320的原因是我们就验证了这两个是绝对没问题的,512的话你可以自己试一试看有没有问题。下图参数改了试试看
【ModelArts产品】【模型训练功能】ModelArts上跑yolov3模型训练失败
发布时间
2020/09/05 14:42:05
最后回复
frag
2020/09/07 20:05:11
版块
AI开发平台ModelArts
1043
3
0
他的回复:
这是进程被kill了,看下资源监控是不是oom或者磁盘满了?
【ModelArts产品】训练yolov3_resnet18作业报错
发布时间
2020/09/02 01:36:07
最后回复
HWCloudAI
2020/09/03 12:23:56
版块
AI开发平台ModelArts
1331
5
0
他的回复:
我这边看到的现象是你的数据集路径里,knife/VOC2007/000315这个路径不存在的报错,是不是没有这里的数据
训练Inceptionv4作业的时候报错
发布时间
2020/08/17 23:02:26
最后回复
frag
2020/08/18 14:36:13
版块
AI开发平台ModelArts
1246
4
0
他的回复:
[WARNING] ME(169:281473212706832,MainProcess):2020-08-16-11:25:09.295.952 [mindspore/train/model.py:527] The epoch_size 200 is not the same with dataset repeat_count 1关键日志是这一句,看起来是你训练设置了要跑200个epoch但dataset那里的设置只设置了1个epoch,麻烦检查下相关的代码
训练作业异常导致扣费
发布时间
2020/08/13 22:26:23
最后回复
蒋俊爽
2020/08/14 09:44:47
版块
AI开发平台ModelArts
1444
2
0
他的回复:
我看到你选的epoch是200呀,不是40,填错了么