作者小头像 Lv.2
135 成长值

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据
个人勋章
TA还没获得勋章~
成长雷达
0
105
0
30
0

个人资料

个人介绍

这个人很懒,什么都没有留下

感兴趣或擅长的领域

暂无数据

达成规则

发布时间 2021/06/17 16:01:48 最后回复 阿媛yy 2021/07/20 23:22:39 版块 社区活动
14312 204 1
发布时间 2021/06/17 16:01:48 最后回复 阿媛yy 2021/07/20 23:22:39 版块 社区活动
14312 204 1
他的回复:
第二阶段新的体会 + yujingv + qzforyou通过第一阶段的学习,对于WeAutomation有了最基本的认识,进入到第二阶段以后,系统学习了和项目开发相关的一些内容,包括变量数据类型和控制流,网页自动化操作,excel和数据标操作,word/Email自动化,这些内容在rpa项目开发中非常实用,是日常办公的经常操作的内容。变量、数据类型、控制流是软件开发的基础内容,华为WeAutomation中支持Boolean、Number、String、Object和Array,覆盖了开发过程中的常用数据类型。可以定义全局变量,这些变量在各个功能控件中可以引用,变量的引用格式是 @{变量名}。学习了赋值控件assign,还有eval计算表达式控件。第六章是常见数据类型的使用,包括字符串操作,List操作,Dictionary操作,Datetime日期数据操作。控制流中主要学习了分支语句和循环语句。网页自动化操作中,主要学习了元素获取WebSelector,网页中图像的相关操作,以及网页表格数据的获取getTable,网页元素的单击click,文本输入type,网页文本获取getType。在练习过程中,可以顺利的使用各个控件完成demo案例。Excel操作章节,学习了Excel的常见操作,包括打开文档,写单元格/区域,读单元格/区域,工作簿表的保存,在excel的操作中,首先要先关闭已存在的excel进程。 WeAutomation还有更强的控件,比如excel透视表的生成,自动数据筛选,运行excel宏等操作,这样就可以完成更多更高级的excel操作。Word自动化中,学习了word的常见操作,打开文档,读取文本,替换文本内容,替换图片等操作,替换图片时要先给图片加上tag标记。Email自动化练习过程中,碰到一点小问题,最初使用的是sohu的邮箱,pop和smtp都是使用的协议和默认值不同,需要修改为简单的smtp,端口调整为110和25,经过测试后使用成功。邮件自动化处理过程中,特别要注意的事情是密码,密码为邮箱授权码,不同邮件服务商的申请方式不太一样。
发布时间 2021/06/17 16:01:48 最后回复 阿媛yy 2021/07/20 23:22:39 版块 社区活动
14312 204 1
他的回复:
阶段1 + yujingv + qzforyou 学习心得RPA是机器人流程自动化,是利用机器人技术来实现业务流程自动化处理,是近年流行起来的新处理技术,是提供数字生产力的有效工具。通过第一阶段的学习,体验到华为WeAutomate是一个非常好用的RPA工具。第一阶段主要学习了WebAutomate的介绍,RPA工具的安装,网页录制和应用程序录制,变量和数据类型。根据训练营课程的指导,顺利安装了华为RPA的Studio,并简单熟悉了一些Studio的界面,进行了控件拖拽和简单案例的练习,相比较其他的RPA产品,华为RPA Studio界面简洁明了。网页录制学习过程中,还是碰到了一些小问题,主要是Web驱动和浏览器插件的安装。在WeAutomate Studio设置界面的Web驱动项目中,Studio已内置了Chrome驱动,但驱动版本太低,需要自行下载(http://chromedriver.storage.googleapis.com/index.html)和安装和chrome浏览器匹配的web驱动。chrome插件的安装也碰到一点小问题,自行百度后根据网上的指导步骤(https://jingyan.baidu.com/article/f54ae2fcc555855f92b849f4.html)进行了安装。应用程序的录制相对来说就比较顺利了,自行练习了计算器的录制练习,但对于微信等复杂节目的程序信息的获取还是没有掌握。变量和数据类型部分和python基本一致,可以使用eval和assign两个控件对于变量赋值,区域在于eval支持表达式或者程序语句的书写。
发布时间 2020/11/09 09:32:08 最后回复 漫游寰宇外 2020/12/07 14:03:28 版块 社区活动
11311 176 0
他的回复:
华为云ID: yujingv  第一章企业应用最广泛的AI案例开发:OCR文字识别 笔记第1章 企业应用最广泛的AI案例开发:OCR文字识别1.1 OCR介绍1. 概述2. OCR介绍3. OCR完成流程4. 文字区域检测5. 字符识别6. OCR相关的开源资源7. OCR面对的挑战 1.OCR简介   OCR光学字符识别   发展时间较长   使用普遍 2.OCR流程   机器学习   图像预处理:去噪、灰度化、图像增强等   文本检测: 滑动窗口算法遍历整张图片   字符分类: 划分单个字符,识别单字   深度学习方法   文本区域检测:将图片中出现的文本位置检测处理,可能存在不同语言,不同文字大小,不同角度倾斜,不同程度遮挡等情况     CTPN:CTPN网络结合了CNN与LSTM深度网络,通过固定宽带的anchor提前proposal,能有效的检测出复杂场景的横向分布的文字区域,不定长度文本识别效果较好,是目前使用广泛的文字检测算法。     EAST:网络分为三部分,特征提取,特征融合和输出层     PixelLink: 采用了实例分割的方法完成文本区域检测,通过将统一实例中的像素链接,通过链接区域分割出文本实例,然后从分割结果中提取文本边界框,进行回归计算。   字符识别算法:将文本区域的字符识别出来。通过深度神经网络对目标区域进行特征提取,然后对固定特征进行提取和比对,得出识别结果。     CRNN+CTC: CRNN卷积循环神经网络,将特征提取,序列建模以及转录整合到统一的模型框架中。CRNN网络分为:卷积层、循环层和转录层三部分,CTC为无词典的转录方式,不会被局限在预定义词汇范围中。  6.OCR相关的开源资源    Tesseract      2006年开源的光学字符识别引擎,因为开源使用以及精准的检测效果,Tesseract的使用十分普遍。    MNIST 手写数字数据集      MNIST数据集包括了大量的手写数字图片,包括6万张训练数据集和1万张测试数据集,是广泛使用的开源数据集之一,很多深度学习任务的入门练习数据集。    COCO-text      包含日常生活里复杂场景中的文字,数据集提供了边界框的位置,区分了打印文字和手写文字,清晰和模糊的文字,文字的内容等标注信息,数据集包括了超过173,589标注了的文本区域,超过63,686张图片。    CTW中文街景数据集      数据集中包含了32285张图片,共计1018402个汉字,3850个汉字类别。标注信息包括了 文字行的边界框 文字单字的边界框 是否遮挡,扭曲 是打印文字或者手写文字等  7.OCR面临的挑战    汉字字符识别      汉字字符的识别难度相比较英文字符要更大,字符的识别过程可以近似为分类,引文字符的分类数远小于汉字单字的数量,所以分类的难度更高。除此之外,多语言混合也是字符分类任务中的挑战,字符识别更加复杂。    手写字符识别      印刷字体遵循固定的规则,而手写字符的识别相比较就更加复杂,每个人的书写习惯都不同,同一个人书写同样的字符也不完全相同,识别难度大大增加。    小结:     OCR机器学习和深度学习对比,了解了OCR的实现步骤以及算法1.2 华为云OCR服务调用指南  第一步: 准备工作    python + pycharm  第二步: 申请服务  第三步: 下载SDK      第四步: 配置SDK    OCRDemo.py    /v1.0/ocr/generla-text  第五步:运行案例1.3 CTPN+CRNN 算法端到端实现文字识别目录  1.OCR简介  2.CTPN与CRNN  3. 动手实践OCR简介  OCR光学字符识别    发展时间较长    使用普遍OCR流程  深度学习方法  文字区域检测:将图片中出现的文本位置检测出来,可能存在不同语言,不同文字大小,不同角度倾斜,不同程度遮挡等情况。    CTPN          字符识别算法:将文本区域的字符识别出来。通过深度神经网络对目标区域进行特征提取,然后对固定特征进行提取和比对,得出识别结果。CTPN  网络结构    CNN-VGG16    RNN    FCCRNN  卷积循环神经网络  卷积层 特征提取  循环层 深度双向LSTM  转录层 将RNN输出做softmax完整的端到端OCR流程  了解了文本区域以及字符识别后,下面详细讲解完整的端到端OCR流程:   (1)准备一张含有文字的原图;   (2)对原图进行文字位置的检测,检测结果可能是水平矩形框,也可能是倾斜矩形框;   (3)从原图中把文字框对应的图片切下来,并旋转正,得到水平的文字块切片图;   (4)对每个文字块切片图依次进行字符识别,每个切片图的识别结果汇总起来,就得到原图的文字识别结果。   因此完整的端到端OCR流程是:输入原图 -> 文字检测 ->文字块切片 -> 字符识别 -> 识别结果汇总。动手实践:  本次案例地址:https://modelarts-labs-bj4.obs.cn-north-4.myhuaweicloud.com/notebook/DL_ctpn_crnn/DL_ocr.zip