- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

【最佳实践】使用MoXing开发训练脚本，实现手写数字识别

云上精选发表于 2020/04/23 18:09:12 2020/04/23

4k+ 0 1

【摘要】基于MoXing框架开发训练脚本，通过AI全流程开发实现手写数字识别的应用

本示例介绍在ModelArts平台如何使用MoXing实现MNIST数据集的手写数字图像识别应用。

开始使用如下样例前，请务必按准备工作指导完成必要操作。使用MoXing实现手写数字图像识别样例的操作流程如下所示。

准备数据：获取MNIST数据集，并上传至OBS。
训练模型：使用MoXing框架编模型训练脚本，并新建训练作业进行模型训练。
部署模型：得到训练好的模型文件后，新建预测作业将模型部署为在线预测服务。
验证模型：发起预测请求获取预测结果。

准备数据

ModelArts在公共OBS桶中提供了MNIST数据集，命名为“Mnist-Data-Set”，因此，本文的操作示例使用此数据集进行模型构建。您需要执行如下操作，将数据集上传至您的OBS目录下，即准备工作中您创建的OBS目录“test-modelarts/dataset-mnist”。

单击数据集下载链接，将“Mnist-Data-Set”数据集下载至本地。
在本地，将“Mnist-Data-Set.zip”压缩包解压。例如，解压至本地“Mnist-Data-Set”文件夹下。
参考上传文件，使用批量上传方式将“Mnist-Data-Set”文件夹下的所有文件上传至“test-modelarts/dataset-mnist”OBS路径下。
“Mnist-Data-Set”数据集包含的内容如下所示，其中“.gz”为对应的压缩包。
- “t10k-images-idx3-ubyte”：验证集，共包含10000个样本。
- “t10k-images-idx3-ubyte.gz”：验证集的压缩包文件。
- “t10k-labels-idx1-ubyte”：验证集标签，共包含10000个样本的类别标签。
- “t10k-labels-idx1-ubyte.gz”：验证集标签的压缩包文件。
- “train-images-idx3-ubyte”：训练集，共包含60000个样本。
- “train-images-idx3-ubyte.gz”：训练集的压缩包文件。
- “train-labels-idx1-ubyte”：训练集标签，共包含60000个样本的类别标签。
- “train-labels-idx1-ubyte.gz”：训练集标签的压缩包文件。

训练模型

数据准备完成后，您需要使用MoXing接口编写训练脚本代码，ModelArts提供了一个编写好的代码示例“train_mnist.py”，如下操作使用此示例训练模型。

从gitee下载ModelArts-Lab工程，并在“ModelArts-Lab”工程的“\ModelArts-Lab-master\official_examples\Using_MoXing_to_Create_a_MNIST_Dataset_Recognition_Application\codes”目录下获取模型训练脚本文件“train_mnist.py”。
将“train_mnist.py”文件上传至OBS，例如“test-modelarts/mnist-MoXing-code”。
在ModelArts管理控制台，进入“训练管理 > 训练作业”页面，单击左上角的“创建”。
在创建训练作业页面，参考图1和图2填写相关信息，然后单击“下一步”。
图1 创建训练作业-基本信息

 图2 创建训练作业-详细参数
在“规格确认”页面，确认训练作业的参数信息，确认无误后单击“提交”。
在训练作业管理页面，当训练作业变为“运行成功”时，即完成了模型训练过程。如有问题，可单击作业名称，进入作业详情界面查看训练作业日志信息。

训练作业需要花费一些时间，预计十几分钟。当训练时间超过一定时间（如1个小时），请及时手动停止，释放资源。否则会导致欠费，尤其对于使用GPU训练的模型项目。
（可选）在模型训练的过程中或者完成后，可以通过创建可视化作业查看一些参数的统计信息。详细操作指导请参见创建可视化作业。
其中，“训练输出位置”请选择训练作业中“训练输出位置”参数中的路径。根据界面提示完成可视化作业创建。

部署模型

模型训练完成后，将模型部署为在线预测服务。其中ModelArts提供了已编写好的推理代码“customize_service.py”和配置文件“config.json”。

从gitee下载ModelArts-Lab工程，并在“ModelArts-Lab”工程的“\ModelArts-Lab-master\official_examples\Using_MoXing_to_Create_a_MNIST_Dataset_Recognition_Application\codes”目录下获取推理代码“customize_service.py”和配置文件“config.json”。
将“customize_service.py”和“config.json”文件上传至OBS中，需存储至OBS中训练作业生成模型的路径，例如“test-modelarts/mnist-model/model”。
- 训练作业将在“训练输出位置”指定路径中新建一个“model”文件夹，用于存储生成的模型。
- 推理代码和配置文件必须上传至“model”文件夹下。
在ModelArts管理控制台，单击左侧导航栏中的“模型管理>模型”，进入“模型”页面，单击左上角“导入”。
在“导入模型”页面，参考图3填写相关参数，然后单击“立即创建”。
在 “元模型来源”中，选择 “从OBS中选择”页签，然后在 “选择元模型”选项中设置为训练作业中的 “训练输出位置”指定的路径，不能设置为此路径下的 “model”文件夹，否则系统无法自动找到模型及其相关文件。
图3 导入模型
在“模型”页面，当模型状态变更为“正常”时，表示模型已导入成功。您单击模型名称左侧的小三角，打开此模型下的所有版本。在对应版本所在行，操作列单击“部署>在线服务”，将模型部署为在线服务。
在“部署”页面，请参考图4的示例填写参数，然后单击“下一步”。
图4 部署在线服务
在“规格确认”页面，确认信息无误后的，单击“提交”。
在线服务创建完成后，系统自动跳转至“部署上线>在线服务”页面。服务部署需要一定时间，耐心等待即可。当服务状态变为“运行中”时，表示服务部署成功。

验证模型

在线服务部署成功后，您可以进入在线服务，发起预测请求测试服务。

在“在线服务”管理页面，单击在线服务名称，进入在线服务详情页面。
在线服务详情页面中，单击“预测”页签，进入预测页面。
在“选择预测图片文件”右侧，单击“上传”按钮，上传一张黑底白字的图片，然后单击“预测”。
预测完成后，预测结果显示区域将展示预测结果，根据预测结果内容，可识别出此图片的数字是“4”。
- 由于推理代码和配置文件中已指定图片要求，用于预测的图片，大小必须为“28px*28px”，图片格式必须为“jpg”，且图片必须是黑底白字。
- 建议不要使用数据集中自带的图片，可以使用Windows自带的画图工具绘制一张。
- 如果是其他不符合格式的单通道图片，预测结果可能会存在偏差。
图5 在线服务预测结果

点赞
收藏
关注作者

作者其他文章

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

开发者空间

了解空间

工作台

开发工具

实战案例

空间活动

空间论坛

开发平台

软件开发生产线 CodeArts

AI平台ModelArts

数据治理中心 DataArts Studio

数字内容生产线 MetaStudio

精选服务

云数据库 GaussDB

云数据库 RDS for MySQL

MapReduce服务 MRS

数据仓库服务 DWS

分布式缓存服务Redis版

分布式消息服务 DMS

华为云实时音视频 SparkRTC

媒体处理 MPC

主机迁移服务 SMS

对象存储迁移服务 OMS

云消息服务 KooMessage

云手机服务 KooPhone

企业搜索服务 KooSearch

云地图服务 KooMap

更多开放能力

开发工具

API生态

CodeArts API

API Explorer

Terraform Explorer

KooCLI

API 中心

SDK 中心

开发服务

Codelabs

DevStar

低代码平台Astro

CodeArts IDE

Huawei Cloud Toolkit

Classroom

开发资源

开源镜像站

开源资源

开发语言

开发实践

入门精选

分发资源

企业应用中心

企业通用专区

教育专区

华为应用专区

政务云专区

硬件云服务商城

医疗健康专区

跳蚤市场

华为云开发者日

直播专区

开发者精品活动

DTSE Tech Talk

加入HCDE

加入HCDG

加入HCSD

加入HCWD

鲁班会

沃土云创计划·企业

沃土云创计划·高校

沃土云创计划·个人

沃土云创计划·开源共创

博客

论坛

专题

开发者榜单

学习路径

在线课程

动手实验

考试认证

培训服务