华为云人工智能入门级开发者认证 - 第③章 华为云EI服务介绍
获取您的EI红宝书:https://www.huaweicloud.com/ei/
华为云EI企业智能官网入口
华为云AI,行业智能化升级新引擎
丰富的API认知服务,赋能千行百业
01 图像识别API服务介绍
什么是图像识别
「图像识别(Image Recognition)」
-
利用计算机对图像进行分析和理解,以识别各种不同模式的目标和对象的技术,提供六大功能,实现全媒介标签和图像优化。
「动植物识别」
「家居识别」
「人像抠图」
「名人识别」
「动漫风格化」
「动漫上色」
应用场景
「场景分析」
-
图像标签功能可准确识别视频,图像内容,提高检索效率和精度,从而使得个性化推荐、内容检索和分发更为有效
「智能相册」
-
可识别上万种通用物体以及数百种场景标签,一个图像可包含多个标签内容,语义内容非常丰富。更智能、准确地理解图像内容,让智能相册管理、照片检索和分类、基于场景内容或者物体的广告推荐等功能更加准确。
「目标检测」
-
在建筑施工现场,基于定制化的图像识别目标检测系统,可实时监测现场人员是否佩戴安全帽,以降低安全风险。
实践案例
「无人收银台」
智能物品识别 | 准确率超95% | 人力节省1~2人/店
「难点」
-
包装问题:无包装、无条码产品多,无法使用传统的射频扫描等技术 -
成本高:收银人员招聘、薪酬等等成本高,人员流动性大
「解决方案」
-
通过目标检测和图像局部搜索融合方案,当前实现准确率95% -
当前设计方案可以减少模型迭代次数,实现蛋糕新品类快速增加
「客户价值」
-
收银自动化节省人力成本 -
人工智能结账提升消费者体验 -
产生大量消费数据及用户数据
图像识别API服务调用
本实验指导用户使用华为云EI图像识别服务SDK来完成图像识别任务
「实验链接」
-
https://lab.huaweicloud.com/testdetail_1713
「实验目标与基本要求」
-
指导用户使用华为云EI图像识别SDK来完成图像识别。通过本实验,您将能够: -
①使用Eclipse创建Java项目。 -
②使用华为云SDK完成图像识别。
「实验摘要」
-
操作前提:登录华为云 -
1.开通服务 -
2.获取AK、SK -
3.调用服务
「相关课程」
-
图像识别服务 -
https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXE025+Self-paced/about
02 图像搜索API服务介绍
什么是图像搜索
「图像搜索(Image Search)」
-
以图搜图,华为云图像搜索基于深度学习与图像识别技术,利用特征向量化与搜索能力,帮助客户从指定图库中搜索相同及相似的图片,通常应用在图片版权、商品推荐等场景。
「相似相同搜索」
「工业零件搜索」
「高效搜索,低成本无人超市」
「建筑设计搜索,同类比价」
应用场景
「商品图片搜索」
-
商品图片搜索分析用户拍摄的图片在商品库中搜索,找到同款或相似的商品,进行商品销售或者相关商品推荐
-
服务支持秒级响应亿级规模图像搜索,支持实时更新数据,商品图片搜索服务省去繁琐的文字描述,简化了商品搜索流程,大大提高了用户的购物体验。
「商品鉴权&侵权图片定位」
-
版权图片是摄影和设计类网站的重要资产,版权图片搜索可以从海量图片库中快速定位侵权盗用图片,帮助图库网站捍卫权益。
实践案例
「盗图查询」
-
华为云与“中国图库”共同创新,实现客户收入飞速增长
图像搜索API服务调用
本实验指导用户使用华为云EI图像搜索服务来完成图像搜索任务
「实验链接」
-
https://lab.huaweicloud.com/testdetail_1714
「实验目标与基本要求」
-
指导用户使用华为云EI图像搜索服务来完成图像搜索任务。通过本实验,您将能够: -
①使用OBS服务来存储图片。 -
②使用华为云EI图像搜索服务来创建图片索引库、添加图片至图片索引库并从图片索引库中搜索相似图片。
「实验摘要」
-
操作前提:登录华为云 -
1.开通图像搜索服务 -
2.创建桶并上传图片 -
3.创建图片索引库 -
4.添加图片至图片索引库 -
5.从图片索引库中搜索相似图片 -
6.删除实例
「相关课程」
-
图像搜索服务 -
https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXE009+Self-paced/about
03 内容审核API服务介绍\
什么是内容审核
「内容审核(Content Moderation)」
基于领先的「图像、文本、视频」的检测技术,可自动检测涉黄、广告、涉政涉暴、涉政敏感人物等内容,帮助客户降低业务违规风险;帮助人工审核提升效率。
「什么是图片审核」
「涉政暴恐」
「涉政敏感人物」
「广告检测」
「鉴黄」
「什么是文本审核」
-
基于海量词库+深度学习+GCN+文本分类等模型,可自动识别出文本中出现的「涉政、涉黄、广告、辱骂、灌水内容」,「网信办7*24小时对接」;可应用在「评论、短信、昵称、弹幕、签名」等审核的内容。
「什么是语音审核」
-
基于深度学习语音识别技术,结合文本审核,过滤语音环境中的「娇喘,暴恐,涉政,广告,辱骂」等不良信息。可应用在音频直播、电台、音乐等内容的审核
「什么是视频审核」
-
支持离线视频及在线直播的审核,审核内容为「图片、文本、语音的集合」.
判断视频是否具有违规风险,从画面、声音、字幕多维度提供违规信息
应用场景
「内容审核」
「游戏、短视频、论坛、IM聊天、直播、网盘、广告、媒资类」
「AI芯片,单张图片处理」
「色情,性感,恐暴,涉政,灌水,谩骂,广告,违禁品,画中画」
「游戏类」
迷你玩「媒体资讯」
封面传媒「电商类」
华为商城「直播,视频网站」
华为视频实践案例
「基于内容审核的短视频方案」
-
助力「短视频」实现「智能」内容审核
-
智能检测“色情内容”、“涉政”和“暴力” -
实现画中画,短视频,图像,文本审核 -
审核效率提升「90%」 -
问题视频「3分钟」内快速处理
内容审核API服务调用
当前实验正在维护
「实验链接」
「实验目标与基本要求」
「实验摘要」
04 文字识别API服务介绍
什么是文字识别
「文字识别」
将图片或者扫描件中的文字转换成可编辑的文本。
「全景图」
5大场景,服务行业应用场景
「文字识别服务流程」
「什么是结构化信息提取?」
应用场景
「证件类OCR」
「发票类OCR」
-
「多种接入方式」自动连接扫描仪,批量获取图像;高拍仪、手机拍照获取图像; -
「部署方式灵活」支持公有云、HCS、一体机等多种部署方式,统一标准API接口;
-
「支持各类发票」增值税普/专/电子/ ETC /卷票,出租车/火车/行程单/定额/通行费等发票; -
「支持一图多票」多种、多种发票混贴自动分类、识别; -
「可视化对比」返回位置信息,转换为Excel格式便于统计、分析。
实践案例
「医疗保险理赔」
-
医疗保险理赔中涉及到多种医疗单据和证件、银行卡等的信息录入和审核工作,通过华为OCR服务,可以将复杂的人工录入工作自动化,加快理赔处理速度,提高用户体验,同时降低人工成本。医疗发票相比增值税发票,打印错位问题较严重,并且发票有较复杂的底纹背景。
「财务报销」
-
支持增值税发票、出租车发票、火车票、行程单、购物小票等票据类,「覆盖企业消费」 -
「主流场景」采购、机票、火车票、用车、用餐、酒店 -
支持一张图包含多张不同种类票据的识别场景「先切分再分别识别」
文字识别API服务调用
使用OCR文字识别服务,快速实现图片转文字功能
「实验链接」
-
https://lab.huaweicloud.com/solutiondetail_567
05 自然语言处理API服务介绍
语音语义类能力全景图
什么是自然语言处理服务
「自然语言处理(Naturl Language Processing)」
-
计算机科学领域与人工智能领域中的一个重要分支,研究如何实现人与计算机之间用自然语言进行有效沟通,让计算机能够「理解」和「生成」人类语言,NLP就是人类和机器之间沟通的桥梁!
应用场景
「语义匹配」
「热词挖掘」
-
基于海量文本,基于语法分析技术挖掘关键词汇,快速获取「用户关注热点」
「信息抽取」
例1例2
「细粒度情感分析」
实践案例
「某基金合同要素抽取」
-
「客户痛点」 基金合同文档偏长,格式复杂(word、pdf、扫描件等),人工审核效率低下。期望能够提供该类合同的要素抽取功能,辅助人工快速审核。
-
「解决方案」
-
「图像识别」,支持识别多格式的合同文件 -
「文档结构分析」,将长文档构建成文档树,有效缩小要搜索范围 -
「要素抽取」抽取文档中的要素内容。 -
「客户价值」
-
有效提升人工审核效率:代替了人工阅读大量文档的方式,系统自动抽取合同中的要素内容,客户只需对抽取结果进行审核。
自然语言处理API服务调用
本实验指导用户熟悉华为云EI-自然语言处理服务的API接口的调用方法
「实验链接」
-
https://lab.huaweicloud.com/testdetail_1715
「实验目标与基本要求」
-
指导用户熟悉华为云EI-自然语言处理服务API接口的调用方法。通过本实验,您将能够: -
① 使用Eclipse创建运行JAVA项目。 -
② 掌握自然语言处理服务JAVA SDK的使用方法。
「实验摘要」
-
指导用户熟悉华为云EI-自然语言处理服务API接口的调用方法。通过本实验,您将能够: -
① 使用Eclipse创建运行JAVA项目。 -
② 掌握自然语言处理服务JAVA SDK的使用方法。
「相关课程」
-
自然语言处理 -
https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXE083+Self-paced/about
06 语音交互API服务介绍
语音语义类能力全景图
什么是语音交互服务
「语音交互服务(Speech Interaction Service)」
-
一种「人机交互方式」,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。
应用场景
「客服质检」
-
涉及能力
-
录音文件识别 -
方案优势
-
话者分离:8K模型单声道话者分离;自动标识客户和客服角色 -
情绪检测:语音情绪检测能力 -
识别率:经过规模验证,垂直领域专属模型 -
客户价值
-
降低成本 -
提升效率
「有声阅读」
-
涉及能力
-
语音合成 -
方案优势
-
云端合成:一次合成,多次使用 -
专属音色:有声阅读专属音色,发声自然 -
客户价值
-
缩短制作时间:快节奏,及时推出有声阅读产品
实践案例
「某税务局语音助手」
-
开启语音交互并唤醒
-
默认不打开语音交互,避免引起不必要的切换; -
设置语音交互模式后,开始唤醒 -
多轮追问澄清
-
如果用户的查询命令不正确,语音助手追问用户澄清用户意图
「某有声阅读」
-
一次合成,多次使用 -
云端合成,音色流畅自然
语音交互API服务调用
本实验指导用户使用华为云EI语音交互服务来完成语音合成和语音识别任务
「实验链接」
-
https://lab.huaweicloud.com/testdetail_1711
「实验目标与基本要求」
-
指导用户熟悉华为云EI-语音交互服务的API接口的调用方法。通过本实验,您将能够: -
① 使用Pycharm创建运行Python项目。 -
② 调用华为云EI-语音交互服务的语音合成API根据文字生成对应音频,调用语音识别API识别音频为对应文本。
「实验摘要」
-
指导用户熟悉华为云EI-语音交互服务的API接口的调用方法。通过本实验,您将能够: -
① 使用Pycharm创建运行Python项目。 -
② 调用华为云EI-语音交互服务的语音合成API根据文字生成对应音频,调用语音识别API识别音频为对应文本。
「相关课程」
-
语音识别 -
https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXE074+Self-paced/about
- 点赞
- 收藏
- 关注作者
评论(0)