【CANN文档速递02期】TensorFlow一站式模型开发向导

举报
昇腾CANN 发表于 2022/05/13 17:03:37 2022/05/13
【摘要】 昇腾910 AI处理器(简称NPU)是华为在2019年发布的人工智能(AI)专用的神经网络处理器。当前业界大多数训练脚本基于TensorFlow的Python API开发,默认运行在CPU/GPU/TPU上,为了使其能够利用昇腾910 AI处理器的澎湃算力执行训练,提升训练性能,我们需要对训练网络脚本进行迁移适配。

昇腾910 AI处理器(简称NPU)是华为在2019年发布的人工智能(AI)专用的神经网络处理器。当前业界大多数训练脚本基于TensorFlow的Python API开发,默认运行在CPU/GPU/TPU上,为了使其能够利用昇腾910 AI处理器的澎湃算力执行训练,提升训练性能,我们需要对训练网络脚本进行迁移适配。

可能面临的困扰

在开始之前,难免会遇到如下问题:

一站式模型开发向导

本期为您整理了TensorFlow模型开发向导,清晰展示了模型开发的全景视图,让模型开发不再迷茫!

可登录昇腾社区(https://www.hiascend.com)进行体验:

软件或文档问题,欢迎到昇腾开源社区( https://gitee.com/ascend/)提issue求助。

关于模型迁移

以上向导给您提供了两种TensorFlow模型迁移方法,开发者可以根据实际情况任选其一:

自动迁移

算法工程师通过迁移工具,可自动分析出原生的TensorFlow Python API在昇腾AI处理器上的支持度,并对脚本进行自动迁移。同时生成迁移报告,枚举所有修改点和无法迁移的API,您可以参考报告对脚本进行相应适配修改。

手工迁移

算法工程师也可直接按照文档罗列的迁移点,自行修改TensorFlow训练脚本,该种方式较为复杂,建议优先使用自动迁移方式。

关于模型训练

以上向导给您提供了两种TensorFlow模型训练方法,开发者可以根据实际情况任选其一:

使用Atlas服务器训练

Atlas训练服务器包含昇腾AI处理器,如果具备相应硬件环境,可直接在Atlas训练服务器执行训练。

使用ModelArts平台训练

ModelArts是华为云提供的面向开发者的一站式AI开发平台,集成了昇腾AI处理器资源池,开发者可以在该平台下体验如何执行TensorFlow训练任务。训练开始前,需要先把数据集和训练脚本上传到华为云上的存储服务(Object Storage Service,简称OBS)中,OBS是一个基于对象的海量存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力;训练结束后,训练结果可以回传到OBS供用户下载。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。