【最佳实践】使用MoXing开发训练脚本,实现手写数字识别

举报
云上精选 发表于 2020/04/23 18:09:12 2020/04/23
【摘要】 基于MoXing框架开发训练脚本,通过AI全流程开发实现手写数字识别的应用

本示例介绍在ModelArts平台如何使用MoXing实现MNIST数据集的手写数字图像识别应用。

开始使用如下样例前,请务必按准备工作指导完成必要操作。使用MoXing实现手写数字图像识别样例的操作流程如下所示。

  1. 准备数据:获取MNIST数据集,并上传至OBS。
  2. 训练模型:使用MoXing框架编模型训练脚本,并新建训练作业进行模型训练。
  3. 部署模型:得到训练好的模型文件后,新建预测作业将模型部署为在线预测服务。
  4. 验证模型:发起预测请求获取预测结果。

准备数据

ModelArts在公共OBS桶中提供了MNIST数据集,命名为“Mnist-Data-Set”,因此,本文的操作示例使用此数据集进行模型构建。您需要执行如下操作,将数据集上传至您的OBS目录下,即准备工作中您创建的OBS目录“test-modelarts/dataset-mnist”

  1. 单击数据集下载链接,将“Mnist-Data-Set”数据集下载至本地。
  2. 在本地,将“Mnist-Data-Set.zip”压缩包解压。例如,解压至本地“Mnist-Data-Set”文件夹下。
  3. 参考上传文件,使用批量上传方式将“Mnist-Data-Set”文件夹下的所有文件上传至“test-modelarts/dataset-mnist”OBS路径下。

    “Mnist-Data-Set”数据集包含的内容如下所示,其中“.gz”为对应的压缩包。

    • “t10k-images-idx3-ubyte”:验证集,共包含10000个样本。
    • “t10k-images-idx3-ubyte.gz”:验证集的压缩包文件。
    • “t10k-labels-idx1-ubyte”:验证集标签,共包含10000个样本的类别标签。
    • “t10k-labels-idx1-ubyte.gz”:验证集标签的压缩包文件。
    • “train-images-idx3-ubyte”:训练集,共包含60000个样本。
    • “train-images-idx3-ubyte.gz”:训练集的压缩包文件。
    • “train-labels-idx1-ubyte”:训练集标签,共包含60000个样本的类别标签。
    • “train-labels-idx1-ubyte.gz”:训练集标签的压缩包文件。

训练模型

数据准备完成后,您需要使用MoXing接口编写训练脚本代码,ModelArts提供了一个编写好的代码示例“train_mnist.py”,如下操作使用此示例训练模型。

  1. 从gitee下载ModelArts-Lab工程,并在“ModelArts-Lab”工程的“\ModelArts-Lab-master\official_examples\Using_MoXing_to_Create_a_MNIST_Dataset_Recognition_Application\codes”目录下获取模型训练脚本文件“train_mnist.py”
  2. “train_mnist.py”文件上传至OBS,例如“test-modelarts/mnist-MoXing-code”
  3. 在ModelArts管理控制台,进入“训练管理 > 训练作业”页面,单击左上角的“创建”
  4. 在创建训练作业页面,参考图1图2填写相关信息,然后单击“下一步”
    图1 创建训练作业-基本信息
    图2 创建训练作业-详细参数
  5. “规格确认”页面,确认训练作业的参数信息,确认无误后单击“提交”
  6. 在训练作业管理页面,当训练作业变为“运行成功”时,即完成了模型训练过程。如有问题,可单击作业名称,进入作业详情界面查看训练作业日志信息。

    训练作业需要花费一些时间,预计十几分钟。当训练时间超过一定时间(如1个小时),请及时手动停止,释放资源。否则会导致欠费,尤其对于使用GPU训练的模型项目。

  7. (可选)在模型训练的过程中或者完成后,可以通过创建可视化作业查看一些参数的统计信息。详细操作指导请参见创建可视化作业

    其中,“训练输出位置”请选择训练作业中“训练输出位置”参数中的路径。根据界面提示完成可视化作业创建。

部署模型

模型训练完成后,将模型部署为在线预测服务。其中ModelArts提供了已编写好的推理代码“customize_service.py”和配置文件“config.json”

  1. 从gitee下载ModelArts-Lab工程,并在“ModelArts-Lab”工程的“\ModelArts-Lab-master\official_examples\Using_MoXing_to_Create_a_MNIST_Dataset_Recognition_Application\codes”目录下获取推理代码“customize_service.py”和配置文件“config.json”
  2. “customize_service.py”“config.json”文件上传至OBS中,需存储至OBS中训练作业生成模型的路径,例如“test-modelarts/mnist-model/model”
    • 训练作业将在“训练输出位置”指定路径中新建一个“model”文件夹,用于存储生成的模型。
    • 推理代码和配置文件必须上传至“model”文件夹下。
  3. 在ModelArts管理控制台,单击左侧导航栏中的模型管理>模型,进入“模型”页面,单击左上角“导入”
  4. “导入模型”页面,参考图3填写相关参数,然后单击“立即创建”
    “元模型来源”中,选择 “从OBS中选择”页签,然后在 “选择元模型”选项中设置为训练作业中的 “训练输出位置”指定的路径,不能设置为此路径下的 “model”文件夹,否则系统无法自动找到模型及其相关文件。
    图3 导入模型
  5. “模型”页面,当模型状态变更为“正常”时,表示模型已导入成功。您单击模型名称左侧的小三角,打开此模型下的所有版本。在对应版本所在行,操作列单击“部署>在线服务”,将模型部署为在线服务。
  6. “部署”页面,请参考图4的示例填写参数,然后单击“下一步”
    图4 部署在线服务
  7. “规格确认”页面,确认信息无误后的,单击“提交”
  8. 在线服务创建完成后,系统自动跳转至“部署上线>在线服务”页面。服务部署需要一定时间,耐心等待即可。当服务状态变为“运行中”时,表示服务部署成功。

验证模型

在线服务部署成功后,您可以进入在线服务,发起预测请求测试服务。

  1. “在线服务”管理页面,单击在线服务名称,进入在线服务详情页面。
  2. 在线服务详情页面中,单击“预测”页签,进入预测页面。
  3. “选择预测图片文件”右侧,单击“上传”按钮,上传一张黑底白字的图片,然后单击“预测”

    预测完成后,预测结果显示区域将展示预测结果,根据预测结果内容,可识别出此图片的数字是“4”

    • 由于推理代码和配置文件中已指定图片要求,用于预测的图片,大小必须为“28px*28px”,图片格式必须为“jpg”,且图片必须是黑底白字。
    • 建议不要使用数据集中自带的图片,可以使用Windows自带的画图工具绘制一张。
    • 如果是其他不符合格式的单通道图片,预测结果可能会存在偏差。
    图5 在线服务预测结果
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。