使用DLI查询即将过期的驾驶证信息
学习了《21天晋级大数据实战营》做对了一道附加题,并参照操作指导写了编使用DLI查询即将过期的驾驶证信息的指导,全文如下:
1任务介绍
使用华为云DLI服务,在给出的驾驶证图片中,查询出12月份到期的驾驶证的人员姓名。
1.1功能概述
这是一个基于OCR场景案例分析。DLI提供信息的计算能力, 通过简单的SQL语句轻松实现。
1.2场景介绍
该场景中,我们有图片数据,图片中有驾驶证信息,如:驾驶人姓名,驾驶证有效期等等。
1.3设计思路
在该方案中,我们将驾驶证信息通过华为提供的文字识别服务中的驾驶证识别服务将图片信息转为文字信息存储在DLI中,并在DLI中执行查询操作。
2、任务执行
2.1 首先申请使用OCR驾驶证 图片识别服务
a) 登录华为云,在华为云官网页面上方的导航栏,选择“产品”。
b) 在“EI企业智能”列表中,单击“文字识别”进入文字识别服务产品页面。 或直接点击链接进入文字识别服务产品页面https://www.huaweicloud.com/product/ocr.html
c)点击立即使用进入文字识别控制台页面,在商用服务的未申请中找到驾驶证识别点申请服务。最终可以在已申请中看到如图:
2.2准备驾驶证图片
驾驶证图片下载地址:http://obs-salepredict.obs.cn-north1.myhwclouds.com/driver-license.rar
2.3上传驾驶证图片
2.3.1 在华为云官网页面上方的导航栏,选择“产品”。在“存储”列表中,单击“对象存储服务 OBS”进入OBS产品页面
2.3.2 在OBS产品页面,单击“进入控制台”进入华为云对象存储服务(OBS)控制台。在OBS控制台页面,单击右上角“创建桶”,进入创建桶页面,如下图,建立OBS桶,桶名称自定义即可,区域选择华北-北京一区。
2.3.3点击列表中的桶名称进入并新建文件夹driver_license如下图
2.3.4 上传驾驶证图片到文件夹driver_license中
2.4 使用数据湖探索服务处理驾驶证信息
2.4.1 创建队列
(1) 进入数据湖探索(DLI)控制台。
a) 在华为云官网页面上方的导航栏,选择“EI 企业智能”。
b) 在“EI 大数据”列表中,单击“数据湖探索”。或直接点击链接:
https://www.huaweicloud.com/product/dli.html
c) 在“数据湖探索 DLI”页面,单击“进入控制台”。
d) 在 DLI 控制台,单击 SQL 作业的“创建作业”超链接(如图 14),进入 SQL 作业的“作业编辑器”界面。
e) 在左侧导航栏中,单击选择队列,单击(如图 15),参考图 16 创建容量为 4CU 的队列cous
2.4.2创建数据库
在“作业编辑器”左侧导航栏中,单击选择数据库,单击(如图 17)创建数据库driver
2.4.3 创建驾驶证信息表
在作业编辑器界面,选择创建的队列和数据库,在SQL编辑器中输入如下内容并执行:
create table driver_license(
filePath string,
result struct < number :string,
name :string,
sex :string,
nationality :string,
address :string,
birth :string,
issue_date :string,
class :string,
valid_from :string,
valid_to :string >
) using ocr options(
path "s3a://obs-cous/driver-license",
ocrApiUrl "/v1.0/ocr/driver-license",
ocrEndpoint "https://ais.cn-north-1.myhuaweicloud.com",
ocrRegion "cn-north-1",
accessKey "AK",
secretKey "SK"
)
其中path为存放驾驶证图片的OBS地址,格式为s3a://桶名称/目录名称, accessKey,secretKey为华为云的AK和SK,若没有,请访问
https://console.huaweicloud.com/iam/?region=cn-north-1&locale=zh-cn#/myCredential页面,管理访问密钥,新增访问密钥创建AK,SK。请保存好生成的AK,SK,后续无法在华为云上查看AK,SK。
2.4.4 查询驾驶证表信息
在SQL作业编辑器中输入SQL并执行:
select * from driver.driver_license
2.4.5 查询出12月份到期的驾驶证的人员姓名。
select
result.name
from
driver.driver_license
where
result.valid_to like '%2018-12-%'
至此,任务完成。
- 点赞
- 收藏
- 关注作者
评论(0)