AI开发:开发者生态为核心,普惠行业为本
大环境下所势
2017年3月,在十二届全国人大五次会议的政府工作报告中,“人工智能”首次被写入政府工作报告, 2017轻量级应用极有可能落地。政府工作报告中提到,要加快培育壮大新兴产业。全面实施战略性新兴产业发展规划,加快人工智能等技术研发和转化,做大做强产业集群。7月,国务院发布《新一代人工智能发展规划》, 明确指出新一代人工智能发展分三步走的战略目标,到2030年使中国人工智能理论、技术与应用总体达到 世界领先水平,成为世界主要人工智能创新中心。
近年来,国家政策驱动高校全面布局人工智能相关学科专业。2018年教育部关于印发《高等学校人工智能创新行动计划》、《促进大数据发展行动纲要》等文件。高校应积极面对国家发展战略转型,立足产业发展对数据智能人才培养的需要,探索数据智能人才培养范式,推动数据智能领域学科发展,瞄准世界科技前沿,为我国新一代人工智能发展提供战略支撑。高校应坚持以经济社会发展需要为导向,主动服务“中国制造2025”等国家战略,紧密对接经济带、城市群、产业链布局,全面深化综合改革,优化高校专业结构,支撑引领产业转型升级。
人工智能作为下一阶段科学变革浪潮的新引擎,将渗透至各行各业,助力传统行业实现跨越式升级,带来广阔的发展前景与良好的市场机遇。AI领域是一个快速增长的领域,整个市场对人才的需求激增,但人才的供应还没有跟上,求职者对同一岗位的竞争不是很激烈,薪资因此也水涨船高。自2016年起,人工智能相关的岗位招聘需求逐年递增,尤其是从招聘网上的岗位数量每日以千为单位的变化来看,现在市场已经是对人工智能人才处于一种急切的需求状态。当然,这也充分现实人工智能行业进入了告诉发展期,不过同时,对高端人才的依赖性也随之攀升了。
人工智能的智能基础是大数据,大数据最关键的部分在于数据分析和挖掘数据的有效价值,而当前正处于人工智能发展的中早期阶段,就目前是长发展的需要而言,大量的数字蓝领人才和AI应用开发人员构成了当前人工智能行业发展人才之基,这就为高校学生就业初期从事的工作指明了方向。数据智能专业是跨多学科的交叉融合的新知识体系,实践性很强,技术发展日新月异,AI应用的开发仍然非常复杂,主要体现在开发流程冗长、烦琐。开发全流程包括数据准备、算法开发、模型开发、应用生成、应用部署和维护等多个环节,链路很长,而且每个环节都需要大量人力和计算资源的投入。所需要的实验环境或者平台资源昂贵,传统的实践教学体系与市场岗位、企业项目脱节,与产业发展、学科发展及个人职业发展脱节。
为何选择ModelArts
人工智能是中国发展的主要推动力之一,而作为人工智能生长动力的算法、算 力及数据等都在快速发展。(1)算法的迭代一从技术层面的创新到思维方式的转变。(2)计算能力为技术变革奠定了基础。随着计算的成本在不断下降以及服务器变得越来越强大,人工智能技术应用普遍。(3)数据,身处大数据时代,生活之中无不之处在产生海量数据。 通过调研了解到多家厂商的开发平台,最终选择华为ModelArts平台,其优势在于算法、算力及在各行各业中的应用,尤其在教育领域。其中算法可以采用平台中已有的通用算法,大大缩短建立时间,同时降低了技术人员的入门门槛。算力可以根据按需方式租用GPU服 务器,降低研究的前期投入。在教学实施应用中,从介绍了人工智能应用开发全流程及其子流程,包括数据准备、算法选择和开发、模型训练、模型评估和调优、应用生成、应用评估和发布、应用维护;以及人工智能应用开发场景化实践,介绍了企业级人工智能平台、面向复杂行业的自动化人工智能系统、基于端+边+云协同的人工智能平台及应用开发。在通过一整套工具链和方法传递,使得每个开发者都可以借助ModelArts平台在具体业务场景下更快、更高效、更低成本地开发出人工智能应用,从而更好地解决各行业各领域面临的实际问题,从教学实施角度上讲具有普适指导意义。
基于ModelArts+HiLens云+边+端协同的人工智能平台及应用开发
云端
ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。“一站式”是指AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署都可以在ModelArts上完成。从技术上看,ModelArts底层支持各种异构计算资源,开发者可以根据需要灵活选择使用,而不需要关心底层的技术。同时,ModelArts支持Tensorflow、MXNet等主流开源的AI开发框架,也支持开发者使用自研的算法框架,匹配您的使用习惯。
面向不同经验的AI开发者,提供便捷易用的使用流程。例如,面向业务开发者,不需关注模型或编码,可使用自动学习流程快速构建AI应用;、面向AI初学者,不需关注模型开发,使用预置算法构建AI应用;面向AI工程师,提供多种开发环境,多种操作流程和模式,方便开发者编码扩展,快速构建模型及应用。内容方面,ModelArts支持应用到图像分类、图像检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景。功能方面,ModelArts支持从数据处理到算法开发、训练、部署、市场、开发流程管理等多种功能。
在ModelArts中,我们都是以数据集为数据基础,进行模型开发或训练等操作的。其中在“数据管理”页面,可以完成数据导入、数据标注等操作,为模型构建做好数据准备。
其中ModelArts支持如下9种类型的数据集。包含图片、音频、文本和其他类别。
图像分类
物体检测
声音分类
语音内容
语音分割
文本分类
命名实体
文本三元组
自由格式
其中,不同类型的数据集,支持不同的功能,如智能标注、团队标注等。
2 创建数据集
创建数据集之前需要一些前提条件:
数据管理功能需要获取访问OBS权限,在未进行委托授权之前,无法使用此功能。
(可以在“数据管理 > 数据集”页面,单击“服务授权”,由具备授权的账号“同意授权”后,即可使用,如果使用“账号”登录,可直接在弹出对话框中同意授权。如果使用“IAM用户”(即子账号)登录,需主账号或具备Admin权限的用户进行授权操作。)
已创建用于存储数据的OBS桶及文件夹。并且,数据存储的OBS桶与ModelArts在同一区域。
需要使用的数据已上传至OBS。
创建数据集步骤如下:
登录ModelArts管理控制台,在左侧菜单栏中选择“数据管理> 数据集”,进入“数据集”管理页面。
单击“创建数据集”,在创建数据集页面单击“创建”即可。
数据集创建完成后,系统自动跳转至数据集管理页面,针对创建好的数据集,可以执行标注数据、发布、版本管理、修改、导入和删除等操作。
3 数据标注
8种不同类型的数据集:图像分类,物体检测,文本分类,命名实体,文本三元组,声音分类,语音内容,语音分割
图像分类
只需要给图片添加相应的标签即完成标注,其中可以给单个照片打标签,也可以给多个照片批量标签,还有修改标注及删除标注的操作。
物体检测
需在图片中使用标注框来框出标注对象,并打上标签,其余与图像分类相似
文本分类
同图像分类,不过是对文本进行标签的标注
命名实体
命名实体场景,是,如“时间”、“地点”等。与文本分类不同的是需对片段进行标注,而不是全文。
文本三元组
三元组标注适用于标注出语句当中形如(主语/Subject,谓词/Predicate,宾语/Object)结构化知识的场景,标注时不但可以标注出语句当中的实体,还可以标注出实体之间的关系,其在依存句法分析、信息抽取等自然语言处理任务中经常用到。
声音分类
对音频数据添加标签
语音内容
播放音频,根据播放内容,在下方“语音内容”文本框中填写音频内容,完成标注。
语音分割
播放音频,根据播放内容,选取合适的音频段,在下方“语音内容”文本框中填写音频标签和内容。
4 模型训练
ModelArts提供了模型训练的功能,方便您查看训练情况并不断调整您的模型参数。您还可以基于不同的数据,选择不同规格的资源池(CPU或GPU)用于模型训练。除支持用户自己开发的模型外,ModelArts还提供了AI市场算法,您可以不关注模型开发,直接使用AI市场算法,通过算法参数的调整,得到一个满意的模型。
模型训练功能说明:
4.1 创建训练作业
在整个AI全流程开发过程中,ModelArts支持多种类型的训练作业。根据您的算法来源不同,选择不同的创建方式。
训练作业的几种算法来源:
算法管理(AI市场)
算法管理中,管理了用户自己创建的算法和AI市场订阅的算法,您可以使用算法管理中的算法,快速创建训练作业,构建模型。如果您不具备算法开发能力,可以使用ModelArts内置的预置算法,通过简单的调参,即可创建训练作业构建模型。
常用框架
如果您已在本地使用一些常用框架完成算法开发,您可以选择常用框架,创建训练作业来构建模型。如果您开发算法时使用的框架并不是常用框架,您可以将算法构建为一个自定义镜像,通过自定义镜像创建训练作业。
创建训练作业流程如下:
1、登录ModelArts管理控制台,在左侧导航栏中选择“训练管理 > 训练作业”,默认进入“训练作业”列表。
2、在训练作业列表中,单击左上角“创建”,进入“创建训练作业”页面。
3、在创建训练作业页面,填写训练作业相关参数,然后单击“下一步”。
a、填写基本信息。基本信息包含“计费模式”、“名称”、“版本”和“描述”。其中“计费模式”当前仅支持“按需计费”,不支持修改。“版本”信息由系统自动生成,按“V0001”、“V0002”规则命名,用户无法修改。
您可以根据实际情况填写 “名称”和 “描述”信息。
b、填写作业参数。包含数据来源、算法来源等关键信息
c、选择用于训练作业的资源。
d、配置订阅消息,并设置是否将当前训练作业中的参数保存为作业参数。
e、完成参数填写后,单击“下一步”完成即可。
4、在“规格确认”页面,确认填写信息无误后,单击“提交”,完成训练作业的创建。训练作业一般需要运行一段时间,根据您选择的数据量和资源不同,训练将耗时几分钟到几十分钟不等。
5 模型管理
5.1 模型管理简介
ModelArts模型管理可导入所有训练版本生成的模型,可对所有迭代和调试的模型进行统一管理。导入模型的4种场景:
从训练中选择:在ModelArts中创建训练作业,并完成模型训练,在得到满意的模型后,可以将训练后得到的模型导入至模型管理,直接用于部署上线。
从模板中选择:相同功能的模型配置信息重复率高,将相同功能的配置整合成一个通用的模板,通过使用该模板,可以方便快捷的导入模型,而不用编写config.json配置文件。
从容器镜像中选择:针对ModelArts目前不支持的AI引擎,可以通过自定义镜像的方式将编写的模型导入ModelArts。
从OBS中选择:如果您使用常用框架在本地完成模型开发和训练,可以将您的模型导入至ModelArts中,直接用于部署上线。
5.2 压缩和转换模型
ModelArts提供了模型转换功能,即将已有的模型转换成所需格式,以便应用于算力和性能更高的芯片上。
模型转换主要应用场景如下所示:
使用Caffe(.caffemodel格式)或者Tensorflow框架(frozen_graph或“saved_model”格式)训练的模型,使用转换功能可转换成om格式,转换后的模型可在昇腾(Ascend)芯片上部署运行;
使用Tensorflow框架训练模型(frozen_graph或“saved_model”格式), 使用转换功能可以将模型转换量化成tflite格式,转换后的模型可以在ARM上部署运行;
使用Tensorflow框架训练模型(frozen_graph或“saved_model”格式), 使用转换功能可以将模型转换量化成tensorRT格式, 转换后的模型可以在nvidia p4 GPU上部署运行。
背景信息:
模型转换当前只支持三种芯片类型,分别为:Ascend、ARM、GPU。
模型转换当前仅支持Caffe和TensorFlow框架训练输出的模型。
压缩/转换任务指定的OBS路径,需确保OBS目录与ModelArts在同一区域。
创建模型压缩/转换任务:
1、登录ModelArts管理控制台,在左侧导航栏中选择“模型管理 > 压缩/转换”,进入模型转换列表页面。
2、单击左上角的“创建任务”,进入任务创建任务页面。
3、在“创建任务”页面填写相关信息。
端侧
1、HiLens Kit
华为HiLens为端云协同多模态AI开发应用平台,提供简单易用的开发框架、开箱即用的开发环境、丰富的AI技能市场和云上管理平台,对接多种端侧计算设备如HiLens Kit,支持视觉及听觉AI应用开发、AI应用在线部署、海量设备管理等。为了让HiLens Kit设备具备AI技能,需要将设备注册至Huawei HiLens控制台,才能在Huawei HiLens控制台上管理设备和技能等。
对于购买了HiLens Kit的普通用户,需要快速安装技能到设备,使其具备AI能力。可以到技能市场购买技能,技能安装完成后,启动技能,在Huawei HiLens设备查看技能运行效,完成后即注销技能。基本流程如下:
对于具备编程能力的用户,可以进行创建技能,即自行开发技能而不是用市场购买好的技能。
2、 部署技能
1、登录Huawei HiLens管理控制台,单击左侧导航栏“技能市场 > 我的技能”。
2、选择需要部署的技能,单击右侧操作列“部署”。
3、在弹出的部署对话框中,勾选需要部署的设备,单击“部署”。
部署完成后,进度上会显示部署成功。
4、部署成功后,您可以前往数据管理,查看技能效果。
3、 启动技能
1、使用HDMI视频线缆连接HiLens Kit视频输出端口和显示器。
2、单击左侧导航栏“设备管理 > 设备列表”,进入“设备列表”页面。
3、单击已注册设备的“技能管理”,已部署的技能状态为“停止”,单击操作列的“启动”,并单击“确定”,确定启动技能运行在端侧设备上。
等待一会,当状态变为“运行中”,则技能成功运行在端侧设备上。
查看技能状态:
同时,您也可以通过显示器查看技能输出数据。
完成后,如果不需要再运行技能,也可以点击停止,或者选择选择卸载即可彻底注销。
应用场景
安全帽作为一种个人头部防护用品,在建筑场所、化工厂以及电力工程等施工现场中,是明令要求每个工人必须佩戴的。利用视频监控系统实时检测作业人员是否佩戴安全帽以及是否有人员是否按照施工要求到位并给出相应的警告信息,对施工现场安全监管有重要的意义。
结果展示:
- 点赞
- 收藏
- 关注作者
评论(0)