ModelArts 专属资源池8卡v100性能测试例子

举报
星月菩提 发表于 2020/11/11 19:14:38 2020/11/11
【摘要】 ModelArts 专属资源池8卡v100性能测试例子

测试脚本使用的模型是resnet50,使用tensorflow 1.13.1框架。

测试代码见附件,代码一共包含4个文件。” trainer_modelarts.py”是使用modelarts进行训练的启动脚本,” trainer_offline.py”是线下进行训练的脚本。

image.png

通过下面地址下载数据集

http://download.tensorflow.org/example_images/flower_photos.tgz

解压以后执行下面命令将数据集文件夹结构进行重构

image.png

重构以后数据目录变为

|-flowers_dataset

         |-train

                   |-label 目录


 

1本地进行性能测试

将数据拷贝到/cache下面,解压压缩包

image.png

 

进入代码目录,执行

python trainer_offline.py --mode=train

 

代码中默认的gpu数量是8,如果数量不是8,请增加参数--num_gpu=1

python trainer_offline.py --mode=train --num_gpu=1

 

 

 

 

2ModelArts上进行测试性能测试

将代码解压后上传到obs, 流入这个代码上传到’obs://cnnorth4-job-test/juyiming-demo/r50_performance’

image.png

 

flowers_dataset上传到obs,例如我上传到’obs://cnnorth4-job-test/juyiming-demo/flowers_dataset’

 

训练作业进行如下配置,选择专属8v100专属资源池,进行训练作业创建。

image.png

 

 

如果是单卡增加参数

num_gpu = 1


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。