【我与ModelArts的故事】和我一起来了解ModelArts

举报
nukinsan 发表于 2023/04/22 23:32:12 2023/04/22
【摘要】 ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。

1、什么是ModelArts

ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端--云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。

2、产品架构

ModelArts是一个一站式的开发平台,能够支撑开发者从数据到AI应用的全流程开发过程。包含数据处理、模型训练、模型管理、模型部署等操作,并且提供AI Gallery功能,能够在市场内与其他开发者分享模型。

ModelArts支持应用到图像分类、物体检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景。


3、产品优势

3.1、一站式

即用,涵盖AI开发全流程,包含数据处理、模型开发、训练、管理、部署功能,可灵活使用其中一个或多个功能。

3.2、易上手

  • 提供多种预置模型,开源模型想用就用。
  • 模型超参自动优化,简单快速。
  • 零代码开发,简单操作训练出自己的模型。
  • 支持模型一键部署到云、边、端。

3.3、高性能

  • 自研MoXing深度学习框架,提升算法开发效率和训练速度。
  • 优化深度模型推理中GPU的利用率,加速云端在线推理。
  • 可生成在Ascend芯片上运行的模型,实现高效端边推理。

3.4、灵活

  • 支持多种主流开源框架(TensorFlowPyTorchMindSpore)
  • 支持主流GPU芯片。
  • 支持Ascend芯片。
  • 支持专属资源独享使用。
  • 支持自定义镜像满足自定义框架及算子需求。

4、功能介绍

繁多的AI工具安装配置、数据准备、模型训练慢等是困扰AI工程师的诸多难题。为解决这个难题,将一站式的AI开发平台(ModelArts)提供给开发者,从数据准备到算法开发、模型训练,最后把模型部署起来,集成到生产环境。一站式完成所有任务。


  • 数据治理

支持数据筛选、标注等数据处理,提供数据集版本管理,特别是深度学习的大数据集,让训练结果可重现。

  • 模型训练

自研的MoXing深度学习框架,更高效更易用,大大提升训练速度。

  • 多场景部署

支持模型部署到多种生产环境,可部署为云端在线推理和批量推理,也可以直接部署到端和边。

  • 自动学习

支持多种自动学习能力,通过自动学习训练模型,用户不需编写代码即可完成自动建模、一键部署。

  • AI Gallery

预置常用算法和常用数据集,支持模型在企业内部共享或者公开共享。

5、ModelArts基础内容

5.1、数据管理

AI 开发过程中经常需要处理海量数据,数据准备与标注往往耗费整体开发一半以上时间。ModelArts数据管理提供了一套高效便捷的管理和标注数据框架。不仅支持图片、文本、语音、视频等多种数据类型,涵盖图像分类、目标检测、音频分割、文本分类等多个标注场景,可适用于各种AI项目,如计算机视觉、自然语言处理、音视频分析等;同时提供数据筛选、数据分析、数据处理、智能标注、团队标注以及版本管理等功能,AI开发者可基于该框架实现数据标注全流程处理。

数据管理平台提供了聚类分析、数据特征分析、数据清洗、数据校验、数据增强、数据选择等分析处理能力,可帮助开发者进一步理解数据和挖掘数据,从而准备出一份满足开发目标或项目要求的高价值数据。

开发者在数据管理平台可以在线完成图像分类、目标检测、音频分割、文本三元组、视频分类等各种标注场景,同时也可以使用ModelArts智能标注方案,通过预置算法或自定义算法代替人工完成数据标注,提升标注效率。

针对大规模协同标注场景,数据管理平台还提供了强大的团队标注,支持标注团队管理、人员管理、角色管理等,实现从项目的创建、数据分配、进度把控、标注、审核、验收全流程。为用户带来标注效率提升的同时,又最小化项目管理开销。

此外,数据管理平台时刻保障用户数据的安全性和隐私性,确保用户数据仅在授权范围内使用。

新版数据管理中将数据集和数据标注功能解耦,更方便用户使用。

5.2、开发环境

软件开发的历史,就是一部降低开发者成本,提升开发体验的历史。在AI开发阶段,ModelArts也致力于提升AI开发体验,降低开发门槛。ModelArts开发环境,以云原生的资源使用和开发工具链的集成,目标为不同类型AI开发、探索、教学用户,提供更好云化AI开发体验。

ModelArts Notebook云上云下,无缝协同

  • 代码开发与调测。云化JupyterLab使用,本地IDE+ModelArts插件远程开发能力,贴近开发人员使用习惯
  • 云上开发环境,包含AI计算资源,云上存储,预置AI引擎
  • 运行环境自定义,将开发环境直接保存成为镜像,供训练、推理使用

ModelArts CodeLabJupyterLab),让AI探索&教学更简单

  • 云原生Notebook,案例内容秒级接入与分享
  • Serverless化实例管理,资源自动回收
  • 免费算力,规格按需切换

5.3、模型训练

模型训练中除了数据和算法外,开发者花了大量时间在模型参数设计上。模型训练的参数直接影响模型的精度以及模型收敛时间,参数的选择极大依赖于开发者的经验,参数选择不当会导致模型精度无法达到预期结果,或者模型训练时间大大增加。

为了降低开发者的专业要求,提升开发者模型训练的开发效率及训练性能,ModelArts提供了可视化作业管理、资源管理、版本管理等功能,基于机器学习算法及强化学习的模型训练自动超参调优,如learning ratebatch size等自动的调参策略;预置和调优常用模型,简化模型开发和全流程训练管理。

当前大多数开发者开发模型时,为了满足精度需求,模型往往达到几十层,甚至上百层,参数规模达到百兆甚至在GB规格以上,导致对计算资源的规格要求极高,主要体现在对硬件资源的算力及内存、ROM的规格的需求上。端侧资源规格限制极为严格,以端侧智能摄像头为例,通常端侧算力在1TFLOPS,内存在2GB规格左右,ROM空间在2GB左右,需要将端侧模型大小控制在百KB级别,推理时延控制在百毫秒级别。

5.4、模型部署

ModelArts提供模型、服务管理能力,支持多厂商多框架多功能的镜像和模型统一纳管。

通常AI模型部署和规模化落地非常复杂。

例如,智慧交通项目中,在获得训练好的模型后,需要部署到云、边、端多种场景。如果在端侧部署,需要一次性部署到不同规格、不同厂商的摄像机上,这是一项非常耗时、费力的巨大工程,ModelArts支持将训练好的模型一键部署到端、边、云的各种设备上和各种场景上,并且还为个人开发者、企业和设备生产厂商提供了一整套安全可靠的一站式部署方式。

6、小结

随着ModelArts所支持内容越来越丰富,相信ModelArts后续的发展会更加美好。


我正在参加【有奖征文第21期】说说你和ModelArts的故事,输出优质产品体验文章,赢开发者大礼包!
https://bbs.huaweicloud.com/blogs/395149

 

 

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。