【API进阶之路】没有AI工程师也能做OCR文字识别
在公司技术委员会副主席这个位置上干了有几个月了,期间,我一方面给研发团队整理各种文档资料,做技术沉淀;一方面给市场/运营帮了几次忙,用技术解决业务问题。上周又解决了一个业务难题,估计是考虑到升职加薪也不能太频繁,老板就奖励了我7天带薪假期,让我自己安排。
(上集故事请查看:《破圈,用一个API代替10人内容团队》)
程序员的工作时间不是996就是007,这突然有了假,干点啥去呢?疫情期间也不能出去浪,有日子没回老家了,回去看看吧。
躺在老家院子里的摇椅上,我妈养的中华田园犬在身边绕来绕去,晃晃悠悠地吃了睡睡了吃,日子虽然无聊,倒也难得清闲。
叮~同样是做研发的高中同学发不脱同志给我打电话,约我晚上去学校旁边吃烧烤。说走就走,到了地方我看见这小子,紧了紧头上的帽子,赶紧坐下。
几杯酒下肚,聊起大家的近况,发不脱表示出了对我的羡慕,“真羡慕你在北京工作,开发的都是些有意思的产品,不像我,待在老家,每天就是围绕销售的需求,让干啥就干啥,实在是没劲,一点成就感都没有。就比如最近销售提了个需求,让我给做一个自动识别名片的功能,你说这玩意能有啥用?”
自动识别名片?现在谁还用名片,不都是微信联系了么,最多也是弄个小程序,一扫码就有自己的个人信息了,多方便。
我说完,发不脱也说:“对啊,现在谁还用名片,所以这个需求销售那边一个月里提了三四次,都被我们给拒绝了,做了也没价值。”
正说到这儿,我看着隔壁桌来了2个小伙子,俩人不太熟的样子,一见面又是握手又是寒暄,最后交换了名片才坐下。这名片难道还真有市场?
看完这一幕,我突然有了点想法,跟发不脱说,还是帮销售实现这个需求吧,又不费事,几行代码就解决了,万一人家有用呢。
没想到发不脱差点跟我急了:“几行代码?你闹呢?文字识别欸,我们又没有AI工程师,没那个技术能力!”
这还不好解决么,说着我掏出手机,打开浏览器进入了华为云API Explorer,搜索“名片识别”,找到对应API,按照接口说明把调用方式发给了发不脱,可不就几行代码的事么。
过去了大概10来天,我已经回公司上班了,发不脱给我发信息:“哥们,谢谢你啊,这个名片识别的功能上线之后才发现,销售们每天能收回来一百多张名片,以前要手动录入CRM,现在扫完就能直接录入了,老板因为这个还给我涨工资了呢,大家还打听我什么时候学的AI,哈哈。”
通过这件事我也意识到,有些功能还真不能光凭自己的直觉和认识,来自一线的声音才是最真实的用户需求。如果你也需要名片识别这个功能,“名片识别API”调用方式如下,拿走不谢。
步骤一:开通服务
1. 进入文字识别OCR主页,单击“立即使用”,进入文字识别Console控制台。
2. 选择服务所在的区域。系统默认显示“华北-北京四”,根据各服务的部署区域选择对应区域,开通与调用的服务必须在同一个区域。
3. 在左侧服务列表中单击需要使用的服务,单击“开通服务”。 服务开通成功后,界面显示已开通的服务。
步骤二:调试服务
通过API Explorer可进行快速调试。
在API Explorer点击文字识别。
我们先看看调用这个API都需要点啥:
看上去获取到名片图片的64位编码或者url就能调用了。
举个栗子
接下来我们就拿“***”的名片调试一下。
1、 获取名片图片的64位编码:把“***”放进Chrome浏览器里,按F12,在弹出窗口点Sources,选中“***”的名片文件,这样就能看到名片的64位编码了。
2、 双击选中图片的base64编码信息,“Ctrl+C”复制,然后粘贴到 API Explorer里,点击“调试”,响应结果里就把“***”的名片信息都识别出来了~(注意不可使用鼠标右键方式进行复制)
—— 分割线 ——
了解更多华为云API信息:
“免费下载创新加速利器《华为云API精选手册》
【拓展阅读】
——活动推荐——
华为云已经成为全球主要云服务供应商,在华为云上开放了2400+ API,包括计算、存储、网络、应用服务、软件开发服务、视频、数据库、EI智能等74+产品,如何利用这些丰富强大的API快速开发自己的应用和服务,成为大家关注的热点。
华为云API学习赛,为入门初学者量身定制的学习平台,以赛带学,学以致用。无需代码,只需下载体验模板,按操作文档操作即可完成作品。参赛、邀请都有丰富奖品,还有机会拿P40 5G手机超级激励!!识别下图二维码即可报名参加。
API入门学习赛·AI人脸识别
API入门学习赛·探险寻宝之旅
如果你也想体验API类应用,那就快来华为云双11开发者专项优惠开放API1元包年,每天免费调用,还能参与抽奖。
- 点赞
- 收藏
- 关注作者
评论(0)