当前位置:主页 > 科学探秘 >

光学字符识别技术:让电脑像人一样阅读(2)

发布: 2015-04-03 08:47  | 来源:未知 | 编辑:4908.com | 查看:

  阶段①:采用新算法,检测准确高效

  一个字母或文字通常可以分为若干个连通区域,如o就拥有一个连通区域,i则拥有两个连通区域,文本检测首先要从图像中切割出可能存在的文字,即候选连通区域,然后再对其进行文字/非文字分类。

  在确定候选连通区域阶段,微软亚洲研究院团队在传统检测方法ER(Extremal Region,极值区域)和MSER(Maximally Stable Extremal Region,最大平稳极值区域)基础之上创新地采用了对比极值区域CER(Contrasting Extremal Region),CER是跟周围的背景有一定对比度的极值区域,这个对比度至少要强到能够被人眼感知到,在低对比度的图像上比MSER效果更好,而且获得 的候选连通区域数量远小于ER,候选范围大大缩小,提高了算法的效率。
 

  为了提高所获得的候选连通区域的质量,微软亚洲研究院团队决定增加一个算法环节去增强CER。尤其在图像模糊、分辨率低或者噪声较多时,提取出来的CER有可能会含有冗余像素或者噪声,这些冗余像素或者噪声的存在会使得后面的文字/非文字分类问题变得更为复杂。
 

  采用基于感知的光照不变(Perception-based IlluminationInvariant, PII)颜色空间中的颜色信息去增强CER可算是此次算法优化的另一个创新之举,利用颜色信息尽可能滤除CER中的冗余像素或者噪声,从而得到 Color-enhanced CER。该颜色空间具有视觉感知一致性,而且对光照不敏感,更接近人眼对颜色的判断。
 

受噪声影响的CER示例

  在实际操作中,并不是每个CER都需要通过颜色信息来增强,因为有很多CER本身颜色均匀,没有噪声,尤其是在图片质量很高的时候。因此,在对CER进行增强操作之前我们会先判断该CER是否需要增强操作,以减少不必要的计算复杂度。
 

对CER的颜色增强效果示例
算法提取出来的候选连通区域结果示例
顶一下
(0)
0%
踩一下
(0)
0%
相关推荐
精彩推荐
南越王宫千年古井仍有活水
摘要:备受关注的南越王宫博物馆,又再掀起一角面纱。
咖啡和茶可降低中风、痴呆症发病
每天喝2-3杯咖啡或3-5杯茶,或者同时喝4-6杯茶或咖啡
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片
本周TOP10