Lv.1
ma
更多个人资料
0
成长值
1
关注
1
粉丝
+ 关注
私信
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
个人勋章
TA还没获得勋章~
成长雷达
0
0
0
0
0
个人资料
个人介绍
这个人很懒,什么都没有留下
感兴趣或擅长的领域
暂无数据
达成规则
以上满足
项可达成此勋章
博客
关注
粉丝
论坛
主题
(0)
|
回复
(76)
强化学习 gameai
发布时间
2021/05/17 20:13:24
最后回复
QGS
2021/07/16 10:56:27
版块
AI开发平台ModelArts
5484
7
0
他的回复:
https://marketplace.huaweicloud.com/markets/aihub/article/detail/?content_id=1cc242aa-a154-402b-ac07-2f2c063bc7e0可以看下这个链接,里面很多免费规格的,可以尝试下
【ModelArts】【训练模型】Training end with return code: 137 运行失败
发布时间
2021/06/08 16:13:58
最后回复
ma
2021/06/09 15:41:44
版块
AI开发平台ModelArts
1339
6
0
他的回复:
batch_size调小一点试试看?
使用Pycharm-Toolkit训练yolov3,训练开始后报错:找不到train.txt
发布时间
2021/02/16 18:11:50
最后回复
ma
2021/02/19 14:07:22
版块
AI开发平台ModelArts
1023
2
0
他的回复:
可以使用AI市场的yolov3https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=948196c8-3e7a-4729-850b-069101d6e95c
训练作业是说链接不上obs因为什么,就一个算法没连上,其他的算法是正常可以连上的
发布时间
2021/02/01 14:24:25
最后回复
Granger_Chu
2021/02/02 00:46:00
版块
AI开发平台ModelArts
1827
6
0
他的回复:
使用的是什么算法?还是自己的算法创建训练作业?
代码直接创建训练作业和创建算法后再创建训练作业结果不一致
发布时间
2021/01/29 19:13:43
最后回复
ma
2021/02/01 09:28:39
版块
AI开发平台ModelArts
2141
10
0
他的回复:
如果你使用的是把你的代码创建算法管理,然后创建训练作业,我理解问题应该是如下,在创建算法时是有一个模型输出映射的:这时候你的train_url不是以s3或者obs开头的,然而你的代码做拷贝的逻辑是以s3和obs开头的路径才会去做拷贝操作,所以在创建算法再创建训练作业时如下红框中的代码逻辑是不会执行的,也就出现了你上述说的那个现象了。
代码直接创建训练作业和创建算法后再创建训练作业结果不一致
发布时间
2021/01/29 19:13:43
最后回复
ma
2021/02/01 09:28:39
版块
AI开发平台ModelArts
2141
10
0
他的回复:
这样看创建训练作业是没问题的,我没有理解你说的创建算法后是什么意思。。
代码直接创建训练作业和创建算法后再创建训练作业结果不一致
发布时间
2021/01/29 19:13:43
最后回复
ma
2021/02/01 09:28:39
版块
AI开发平台ModelArts
2141
10
0
他的回复:
我看debug日志里面调用了五次obsClient.putContent呀,那应该是拷贝了五个文件呀,你这个作业跑完后train_url下面只有一个文件?
代码直接创建训练作业和创建算法后再创建训练作业结果不一致
发布时间
2021/01/29 19:13:43
最后回复
ma
2021/02/01 09:28:39
版块
AI开发平台ModelArts
2141
10
0
他的回复:
这里你看下是否可以这样操作,在你拷贝代码前面:import logginglogger = logging.getLogger()logger.setLevel(logging.DEBUG)src_path = xxxprint(mox.file.list_directory(src_path))mox.file.copy_parallel(src_path, args.train_url)然后再把日志共享下
代码直接创建训练作业和创建算法后再创建训练作业结果不一致
发布时间
2021/01/29 19:13:43
最后回复
ma
2021/02/01 09:28:39
版块
AI开发平台ModelArts
2141
10
0
他的回复:
就是这个代码直接创建训练作业的形式跑的话:打印出来是5个,拷贝过去是五个;如果把这个代码创建算法然后再跑训练作业跑的话:打印出来是5个,拷贝过去只有1个;是我这样理解吗?
代码直接创建训练作业和创建算法后再创建训练作业结果不一致
发布时间
2021/01/29 19:13:43
最后回复
ma
2021/02/01 09:28:39
版块
AI开发平台ModelArts
2141
10
0
他的回复:
你可以看一下你这段代码的位置是在哪里,是否在拷贝的时候那个文件夹下面就只有这么一个文件呢?可以在拷贝前list一下源目录