阅卷系统图像识别算法研究之一:图像灰度化算法

举报
开拓者 发表于 2019/09/24 20:41:59 2019/09/24
【摘要】 阅卷系统首先是对识别的答题卡进行拍照,众所周知移动终端摄像头拍摄的图片默认是彩色的,这种图片含有大量的颜色数据信息,存储是24位JPG或BMP格式的,直接处理起来将会占用大量的运算资源,造成整个阅卷系统底下。我们需要判别的只是填涂和不填涂这两个特征值,与颜色无关,故可将彩***片处理为灰度图来减轻运算压力,提高后续的识别速度和效率。

阅卷系统首先是对识别的答题卡进行拍照,众所周知移动终端摄像头拍摄的图片默认是彩色的,这种图片含有大量的颜色数据信息,存储是24JPGBMP格式的,直接处理起来将会占用大量的运算资源,造成整个阅卷系统底下。我们需要判别的只是填涂和不填涂这两个特征值,与颜色无关,故可将彩***片处理为灰度图来减轻运算压力,提高后续的识别速度和效率。

   根据色度学颜色模型理论,任意一种颜色均可用RGB三种基本颜色根据权重量配比合成。RGB即为红、绿、蓝三种颜色,由于彩色的图片是24位格式存储,故每一个颜色都是8位来表示的,即每一种的取值范围是0-255[[i]]。也就是彩色的图片转为灰度图之后,一张灰度图的灰度级别范围是256级。

如果我们把灰度值定义为Grav0-255),在RGB颜色模型理论里彩***片RGB每个分量经过某种特定算法处理后都相等且等于Grav值,也就是Grav就可以代表这张彩***片,由RGB分量根据特定算法计算出Grav值的过程就是彩色的图片的灰度化处理。

目前有三种常用的处理算法:

1)最大值算法:如公式3-1所示,这种算法是比较图片中RGB三个颜色分量的数字大小,然后选择其中一个较大的作为该图片的灰度值Grav

                   Grav=Max(R,G,B) (公式3-1

这种处理方法比较简单直接,但获得灰度值结果比较大。

3-2是在原图3-1基础上采用最大值算法得到的,如图所示本算法得到的灰度图偏亮。

 

spacer.gifspacer.gif
       3-1 未处理原图                   3-2 最大值算法灰度图

 

    2)加权平均值算法:在我们观察一张彩***片时,我们总会感觉绿色部分最突出明显,蓝色部分则不太明显,红色部分居于绿色和蓝色中间感觉,这是由于我们人眼对RGB三种颜色分量的敏感度不同造成的[[i]]。如公式3-2,公式3-3所示,加权平均值算法就是对RGB三个颜色分量设置加权系数。

                Grav=(a*R+b*G+c*B) (公式3-2

Grav=3R=3G=3B  (公式3-3

一般认为,当a=0.299b=0.587c=0.114时,转换得来的图像是人眼观看最适宜的灰度图,也即加权平均值算法公式如公式3-4所示。

                Grav=(0.299*R+0.587*G+0.114*B) (公式3-4

3-3是在原图3-1基础上采用加权平均值算法得到的,如图所示本算法得到的灰度图亮度适宜。

 

 

spacer.gif
3-3 加权平均值算法灰度图

3)平均值算法:如公式3-5所示,平均值算法也即将RGB三个颜色分量的数值求平均值,这种算法也比较简单,获得的灰度值较好的反映了图像的本征值。              Grav=(R+G+B)/3(公式3-5

spacer.gif
3-4是在原图3-1基础上采用平均值算法得到的灰度图,图像比较柔和。

3-4 平均值算法灰度图

 

为了使上述实验结果更加有说服力,我们在用另外一张色彩比较深的图片做灰度化处理做对比,从而观察各种算法的实际效果,实际效果如图3-53-63-73-8

GB三个颜色分量的数值求平均值,这种算法也比较简单,获得的灰度值较好的反映了图像的本征值。              Grav=(R+G+B)/3(公式3-5

spacer.gif
3-4是在原图3-1基础上采用平均值算法得到的灰度图,图像比较柔和。

3-4 平均值算法灰度图

 

为了使上述实验结果更加有说服力,我们在用另外一张色彩比较深的图片做灰度化处理做对比,从而观察各种算法的实际效果,实际效果如图3-53-63-73-8

spacer.gifspacer.gif
     3-5 未处理原图                            3-6 最大值算法灰度图

spacer.gifspacer.gif
     3-7 加权平均值算法灰度图               3-8平均值算法灰度图

  综上所述,加权平均值是最优的算法,本方案采用加权平均值进行答题卡拍摄图片的灰度化处理,进而得到适合后续处理的灰度图。


[[i]] Park J H, Park C W. The YIQ Model of Computed Tomography Color Image Variable Block with Fractal Image Coding[J]. 2016, 10(4):263-270.


[[i]] 朱清溢. 彩色编码结构光三维测量的研究[D]. 四川大学, 2006.



【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。