【CANN文档速递02期】TensorFlow一站式模型开发向导
昇腾910 AI处理器(简称NPU)是华为在2019年发布的人工智能(AI)专用的神经网络处理器。当前业界大多数训练脚本基于TensorFlow的Python API开发,默认运行在CPU/GPU/TPU上,为了使其能够利用昇腾910 AI处理器的澎湃算力执行训练,提升训练性能,我们需要对训练网络脚本进行迁移适配。
可能面临的困扰
在开始之前,难免会遇到如下问题:
一站式模型开发向导
本期为您整理了TensorFlow模型开发向导,清晰展示了模型开发的全景视图,让模型开发不再迷茫!
可登录昇腾社区(https://www.hiascend.com)进行体验:
软件或文档问题,欢迎到昇腾开源社区( https://gitee.com/ascend/)提issue求助。
关于模型迁移
以上向导给您提供了两种TensorFlow模型迁移方法,开发者可以根据实际情况任选其一:
自动迁移
算法工程师通过迁移工具,可自动分析出原生的TensorFlow Python API在昇腾AI处理器上的支持度,并对脚本进行自动迁移。同时生成迁移报告,枚举所有修改点和无法迁移的API,您可以参考报告对脚本进行相应适配修改。
手工迁移
算法工程师也可直接按照文档罗列的迁移点,自行修改TensorFlow训练脚本,该种方式较为复杂,建议优先使用自动迁移方式。
关于模型训练
以上向导给您提供了两种TensorFlow模型训练方法,开发者可以根据实际情况任选其一:
使用Atlas服务器训练
Atlas训练服务器包含昇腾AI处理器,如果具备相应硬件环境,可直接在Atlas训练服务器执行训练。
使用ModelArts平台训练
ModelArts是华为云提供的面向开发者的一站式AI开发平台,集成了昇腾AI处理器资源池,开发者可以在该平台下体验如何执行TensorFlow训练任务。训练开始前,需要先把数据集和训练脚本上传到华为云上的存储服务(Object Storage Service,简称OBS)中,OBS是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力;训练结束后,训练结果可以回传到OBS供用户下载。
- 点赞
- 收藏
- 关注作者
评论(0)