阅卷系统图像识别算法研究之一:图像灰度化算法
阅卷系统首先是对识别的答题卡进行拍照,众所周知移动终端摄像头拍摄的图片默认是彩色的,这种图片含有大量的颜色数据信息,存储是24位JPG或BMP格式的,直接处理起来将会占用大量的运算资源,造成整个阅卷系统底下。我们需要判别的只是填涂和不填涂这两个特征值,与颜色无关,故可将彩***片处理为灰度图来减轻运算压力,提高后续的识别速度和效率。
根据色度学颜色模型理论,任意一种颜色均可用R、G、B三种基本颜色根据权重量配比合成。R、G、B即为红、绿、蓝三种颜色,由于彩色的图片是24位格式存储,故每一个颜色都是8位来表示的,即每一种的取值范围是0-255[[i]]。也就是彩色的图片转为灰度图之后,一张灰度图的灰度级别范围是256级。
如果我们把灰度值定义为Grav(0-255),在RGB颜色模型理论里彩***片RGB每个分量经过某种特定算法处理后都相等且等于Grav值,也就是Grav就可以代表这张彩***片,由R、G、B分量根据特定算法计算出Grav值的过程就是彩色的图片的灰度化处理。
目前有三种常用的处理算法:
(1)最大值算法:如公式3-1所示,这种算法是比较图片中R、G、B三个颜色分量的数字大小,然后选择其中一个较大的作为该图片的灰度值Grav。
Grav=Max(R,G,B) (公式3-1)
这种处理方法比较简单直接,但获得灰度值结果比较大。
3-2是在原图3-1基础上采用最大值算法得到的,如图所示本算法得到的灰度图偏亮。
图3-1 未处理原图 图3-2 最大值算法灰度图
(2)加权平均值算法:在我们观察一张彩***片时,我们总会感觉绿色部分最突出明显,蓝色部分则不太明显,红色部分居于绿色和蓝色中间感觉,这是由于我们人眼对R、G、B三种颜色分量的敏感度不同造成的[[i]]。如公式3-2,公式3-3所示,加权平均值算法就是对R、G、B三个颜色分量设置加权系数。
Grav=(a*R+b*G+c*B) (公式3-2)
Grav=3R=3G=3B (公式3-3)
一般认为,当a=0.299、b=0.587、c=0.114时,转换得来的图像是人眼观看最适宜的灰度图,也即加权平均值算法公式如公式3-4所示。
Grav=(0.299*R+0.587*G+0.114*B) (公式3-4)
图3-3是在原图3-1基础上采用加权平均值算法得到的,如图所示本算法得到的灰度图亮度适宜。
图3-3 加权平均值算法灰度图
(3)平均值算法:如公式3-5所示,平均值算法也即将R、G、B三个颜色分量的数值求平均值,这种算法也比较简单,获得的灰度值较好的反映了图像的本征值。 Grav=(R+G+B)/3(公式3-5)
图3-4是在原图3-1基础上采用平均值算法得到的灰度图,图像比较柔和。
图3-4 平均值算法灰度图
为了使上述实验结果更加有说服力,我们在用另外一张色彩比较深的图片做灰度化处理做对比,从而观察各种算法的实际效果,实际效果如图3-5、3-6、3-7、3-8。
G、B三个颜色分量的数值求平均值,这种算法也比较简单,获得的灰度值较好的反映了图像的本征值。 Grav=(R+G+B)/3(公式3-5)
图3-4是在原图3-1基础上采用平均值算法得到的灰度图,图像比较柔和。
图3-4 平均值算法灰度图
为了使上述实验结果更加有说服力,我们在用另外一张色彩比较深的图片做灰度化处理做对比,从而观察各种算法的实际效果,实际效果如图3-5、3-6、3-7、3-8。
图3-5 未处理原图 图3-6 最大值算法灰度图
图3-7 加权平均值算法灰度图 图3-8平均值算法灰度图
综上所述,加权平均值是最优的算法,本方案采用加权平均值进行答题卡拍摄图片的灰度化处理,进而得到适合后续处理的灰度图。
[[i]] Park J H, Park C W. The YIQ Model of Computed Tomography Color Image Variable Block with Fractal Image Coding[J]. 2016, 10(4):263-270.
[[i]] 朱清溢. 彩色编码结构光三维测量的研究[D]. 四川大学, 2006.
- 点赞
- 收藏
- 关注作者
评论(0)